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فهرسة مكتبة الملك فهد الوطنية أثناء النشر 

رشوان» محسن 

مقدمة في حوسبة اللغة العربية./ محسن رشوان؛ المعتز بالله 
السعيد .-الرياضء ٠55١ه‏ 
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لايسمح بإعادة إصدار هذا الكتاب» أو نقله في أي شكل أو وسيلة» 
سواء أكان إلكترونية أم يدوية أم ميكانيكية» بها في ذلك جميع أنواع تصوير المستندات بالنسخ» أو 
التسجيل أو التخزين» أو أنظمة الاسترجاع» دون إذن خطي من المركز بذلك. 
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الات esl‏ ل وإعداد قاعدة البيانات الصوتية a rm‏ 
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٠ بعض النقاط البحثية ال هامة من أجل دعم خطة طريق لمعالجة التركيب في‎ -A 


| اللغة العربية 
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كلمة المركز 


يعمل المركز في Jue‏ البحث العلمي ونشر الكتب مستهدفاً التركيز على المجالات 
ton‏ مزالت واه إل GES le al i‏ الت i‏ ولفت JA‏ 
الباحثين والجهات الأكاديمية إلى أهمية استثغارها بمختلف وجوه الاستشار» وذلك مثل 
Jie‏ (التخطيط اللغوي) و (العربية في العالم) و(الأدلة والمعلومات) و (تعليم العربية 
لأبناتها أو لغير الناطقين (le‏ إلى غير ذلك من المجالات» وإن من أهم OVE‏ البحث 
المستقبلية في اللغة العربية dle‏ (العربية والحوسبة » والذكاء الاصطناعي) حيث إن 
حياة اللغات ومستقبلها مرهونة بمدى Ge gh‏ مع التطورات التقنية والعالم الافتراضي» 
وكثافة المحتوى الالكتروني المكتوب» وهو ما يشكل تحديا حقيقيا أمام اللغات غير 
المنتجة للمعرفة أو للتقنية. 

وقد عمل المركز على تسليط الضوء على هذا المجال التخصصى؛ مستعينا بالكفاءات 
القادرة من المهتمين بالتخصص البيني oy)‏ اللغة poeti‏ جهودهم» Boley‏ 
إلى نشرهاء وتعميم مبادئهاء راغباً أن يكون هذا المسار العلمي مقررا في الجامعات في 
كلية العربية والحاسوب» ومجالا بحثيا يقصده الباحثون الأكاديميون» والجهات البحثية 


PE 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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وقد أصدر المركز سابقا ستة عشر LES‏ ختصا في (حوسبة العربية) وفي الإفادة من 
«المدونات اللغوية) في الأبحاث العربية» ويحتفل بإصدار سبعة كتب جديدة مختصة في 
(حوسبة العربية والذكاء الاصطناعي) » ويقدمها للقارئ العربي» وللجهات الأكاديمية؛ 
للإفادة منها في مناهج التعليم والبناء عليه» وهذه الكتب السبعة هي: (العربيّة والذّكاء 
الاصطناعيٌ» تطبيقات الذكاء الاصطناعي في خدمة اللغة العربية» خوارزميات الذكاء 
الاصطناعي في تحليل النص العربيء مقدمة في حوسبة اللغة العربية» الموارد اللغوية 
تاسوريف Sal‏ الآلية للنصوص العربية» تطبيقات أساسية في المعالحة الآلية للغة 
ا 


ويشكر المركز السادة مؤلفي الكتب» ومحرريهاء لما تفضلوا به من عمل علمي 
رصينء وأدعو الباحثين والمؤلفين إلى التواصل مع المركز لاستكال المسيرة» وتفتيق 


وفق الله الجهود وسدد الرؤى. 


الأمين العام 
أ. د. محمود إسماعيل صالح 
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مع الطفرة المعلوماتية Jl‏ شَهِدَها Kil‏ 5 الحادي والعشرون» أمكنّ إخضاع الآلة 


ALA‏ نُصُوص الحا الس Slug‏ ذلك في توفير الوقت والجهد البشريّ 
المبذول؛ Lb pt‏ حينَ AV Shen‏ بمجموعات كبيرة من صوص Ji‏ 

وقد حَظيت ial‏ العربيّة بعناية الباحثينَ في معا obi‏ الطَّيعيّ في المشرق 
to illy‏ وساعدّت بعش خصائص AU‏ العريية على تطوير أدواتٍ ناجعة etel‏ 
آلا ol aad she Ge‏ ومن هذه الخصائص الطَّبيعةٌ القياسيّة للصّرف AN aon!‏ 
colgol glad cs CEES‏ التحليل d; d A‏ الوقت ذاته» مثلّت بع خصائص 
العربيّة تحدياتٍ أمام cheia ga‏ مثل طبيعة نظامها الكتايّ» وطبيعة بنيتها uS AN‏ 

tif Aoi, العربيّة‎ ab BV dul إلى الوقوف على طرائق‎ Ces 
آملينَ‎ Gall للقارئ العريّ كتاب (مُقدّمة في حَوسبة اللّغة‎ aad b dL 
اللّغة العربية‎ LW كبيرًا في مصادر‎ Ga GWE AIS في إثراء المكتبة‎ eed أن‎ 
الباحثينَ لطرق هذا الميدان وتنمية أساليب‎ gol الباب‎ Aas بذلكَ‎ Ula, وتقنياتها.‎ 
البحث فيه.‎ 


syys 
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ييا 


tle lal Cu LM raptae‏ ماله 
SPI E nies Un Pos‏ 
Dc‏ عل ا a‏ 


الفصل الأوّل: مدخل إلى حَوسَبة TEE‏ حَوسَبة PATE‏ وأبرز 
الاصطلاحات المستخدمة في التعبير عن هذا PIENE‏ للتحدّيات 
تي تُواجة EUs i‏ اللغات LY!‏ واللغة العربيّة على وجه etl‏ 
spall cy‏ تمهيدًا حول cou cU‏ الإنسانيّة ووظائفهاء PIT‏ 
Parr Ub ase eb esos d saxa De adds‏ 

الفصل الثاني: ال an‏ دراسة GA opal EL‏ في 
العصر الحديث» قد Gi‏ لذلك elei abiha wal,‏ في AI Lull‏ 
co sali‏ اللّغويٌ ومفاهيمها. ويعرض هذا الفصلٌ لكيفيّة التحليل Gall‏ 


kl من خلال الإبانة عن الأجهزة الأساسيّة لحوسّبة الصوت‎ Gt 
تحليل أصوات اللّغة.‎ 3 $i ole Shs وكذلك الأدوات‎ 


الفصل eJ‏ التحليل UN! d al‏ للمُفردات العربيّة؛ يُعنى هذا Jaai‏ 
بطبيعة البناء all‏ في اللغة العربية pa À P‏ الحجم حصيلة colo ll‏ 
العربيّة. RA.‏ م تعريفًا للتحليل eda s OM à AJ‏ والالتباس G al‏ 
وأساليب إزالته. ويعرض GUIS‏ للمواوذ abi‏ اللازمة لإزالة الالتباس 
"p‏ 

الفصل الرّابع: التحليل RAE ius I‏ هذا Vue Jail‏ حول علاقة 
Epor cam‏ ُمّ مدخلا إلى تركيب dA‏ 
الل SI Lull,‏ ا . ويعرض ij xi cosi ely CU. uds‏ 


LES I]‏ واتجاهاتها do s‏ مع التّمثيل عليها . ويعرض الفصل أيضًا لبعض 
قاط Gn‏ ساعد في تطوير EFE‏ 


-\ Y- 


. الفصل الخامس: التحليل å rate qat‏ مدخلا للتّحليل SNA‏ في اللّغات 
الطبيعيّة عمومّاء وني al‏ العربيّة على وجه الخصوص. ویعرض لشبكات 
Tee oY‏ کا عرض للالتباس aya‏ وأساليب el‏ ويعرض 


كذلك لتطبيقات التّحليل VIN‏ والعنونة cot $220 VG‏ اللّْويّة. 
* الفصل السّادس: Jed‏ المحجميّ gl, JI‏ هذا الفصل تتمّة uelis‏ 
التحليل اللغويّ؛ حيث ra‏ لفهوم التحليل المعجميّ» > ویعرض oÍ‏ 


Rx. أساسية أم ثانوية.‎ DUIS cass: سواء‎ 5 pol 
Fis جمعًا وتحريرًا‎ aril مراحل الصناعة‎ GON Game DUA 
E SAU مكوّنات المعجم‎ ZI zu ويعرض كذلك لأدوات‎ 
qund على المعجم‎ 

ّنا نأمل أن h SUNS Je‏ في هذا الكتاب ial Ls‏ لحوسبة PAR‏ 


d‏ على فهم منطق الآلة في lo pal GAL LN‏ اللّغة وتراكيبهاء بصورَتَيها : المنطوقة 
Cor is ee ee ee‏ 


JL.‏ الله تعالى أن يتقبّل هذا الجهدَ بالذكر cdl‏ والأجر الجزيل» وأن det‏ من 
العلم الذي ينفح أصحابه بعد مماتهم. 
t$,‏ عليك u$ s‏ وإليك أتبنا وإليك المصير. 


SPOT) 
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هذه الطبعة إهداء من المركز 
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syg 


الفصل الأول 
مدخل إلى حوسبة اللغة 


us 4‏ 
د. حن رَشوان 


-١‏ مُستويات التحليل ا 

؟- الّحرٌّيات التي تواجه تقنيات اللّخات KUYI‏ 
-Y‏ التحديات التي تُواجه معالجحة اللغة العربية. 

LGN lal co ss lll 4ت‎ 

UNA EE‏ ا للع اعرف 

DLE Bale cle yb Liou al 1 
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هذه الطبعة إهداء من SAM‏ 
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iu 
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Me 
الله‎ TEE st E ag el a eet Mea od 
As ظهرٌ في مطلع التصف الثاني من القرن العشرين باعتباره علا‎ Cd حديثٌ‎ tle 

dake‏ فيه على الحاسوب لدراسة اللّغات الإنسانيّة وفهم طبيعتها. 
نتا إلى هذا العلم SLU Leal Ja «5,21 Clay‏ الحاسوبيّة 
«(Computational Linguistics - CL)‏ و مُعالحة t‏ ا Natural)‏ 
«(Language Processing - NLP‏ وتقنيات AT ia‏ (الإنسانيّة) Human)‏ 
Technologies - HLT‏ ]) . ومع ER TP‏ وتفاوت أساليب 
دراستها بين ا والحاسوبيين» ll ET‏ تدوز حميعًا à ilo à‏ واحدة» هي دائرة 
ذلك العلم الذي 0233 من خلاله أنظمة الحاسوب إلى فهم oL aad‏ وا الك 
وتقومٌ ge alios‏ ثلاثة محاور أساسيّة هي : 
° تقنيات معالحة (Text Processing) RP‏ ومن أمثلتها: da JI‏ الآ 
والتلخيص IM‏ والتنقيب في التصوص: 
e‏ تقنيات معالحة الكلام المنطوق (Speech Processing)‏ - ومن أمثلتها: ao‏ 
UI‏ على الكلام المنطوقء وتحويل al‏ المكتوب إلى كلام منطوق. 
.(Image Processing) 3528] coL s‏ ومن أمثلتها: NI eye‏ على 
الكتابة (Optical Character Recognition - OCR)‏ . 
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ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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3 3 
-١‏ مُستويات التُحليل e 9A‏ 
id PIE‏ - إلى ما جرى عليه الباحثون في حوسبة N‏ من ترتيب مراحل 


Jr على النّحو الموضّح في الشّكل‎ d S ني‎ as n aed 


Lexical analysis التحليل المعجمىّ‎ 


Semantic analysis {YM التحليل‎ 


Syntactic analysis CoS! التتحليل‎ 


Morphological analysis à pa)! التحليل‎ 


Phonological analysis (799594) التحليل‎ 


الكل By c x ld: Y- Y‏ ما جرع عليه الباحفون. 
ووفقًا للعديد من اللغات الإنسانيةء Se‏ بنا أن did‏ جود تداملٍ وارتباط بين 
مُستويات التحليل اللْعَويّ؛ وإذا OT U feel‏ هذه المستويات JF‏ مجموعة من الدّرَجَات 
المتعاقبة» فباستطاعتنا أن KS‏ طبِيعَتّها haley‏ على oul‏ التّال: 


A 


(Phonological analysis) التحليل الفونولو جي‎ ENS 
في هذه الدرجة حسم طريقة ة طق الكلمة مع مُراعاة امروف التي لا نطق أو‎ es 
التي يلتقي فيها السّاكنان).‎ aal EEA Gy BIS) على غير أصلها‎ Ghd التي‎ 
dou تساعد على معرفة‎ Tre S La MT Ados Il de و علوم‎ 
الكريم » مع ملاحظة التي بينها وبينَ قواعد طق العربيّة الفصحى في عُمُو‎ 
صعوبةٌ تكم في عدم استخدام الحركات‎ - Lo das - Hall وتواجهنا فق‎ 


القصيرة (short vowels)‏ وهذا يجعل gyi lai al Soll‏ لكليات العرية مهمة 
صعبة Ais d uet) cid gat js lis‏ ل 
مثل العديد من eat‏ اللاتينيّة 


(Morphological analysis) à pall التحليل‎ -Y,\ 
تحليل الكلمة إلى عناصرها الأساسيّة (السّابق والجذع‎ de sal ويتم في هذه‎ 
أكثر‎ - ils - É Al العربيّة الاشتقاقيّة يوجد للكلمة‎ UI ووفقًا لطبيعة‎ (GSU, 
م هذا‎ IE إلا ّنا نستطيع اختيار الاحتهال الأكثر مناسبة من خلال السّياق.‎ n من‎ 
كذلك - في تحديد أقسام الكلام‎ - sels الاختيار باستخدام الطَرّق الإحصائيّة التي‎ 

wile sulle cbe (Parts of Speech) 


(Syntactic analysis) C gei التحليل‎ -Y, 
polen i e rd لع‎ 
NM Fa مروتها‎ Cod adi ap M lg 

الجملة (كأن يتقد elis‏ الخبر على المبتداً أو sty‏ الفاعل عن المفعول). 

ومن Yigg etl deb‏ يمكن JAE‏ دور call‏ عند التخليل JA (à d SI)‏ 
الوظيفة النحويّة للكلمة. ومثال ذلك كلمة (عامل)؛ فهي من الناحية الصرفيّة (اسم 
فاعل) من الفعل ESI (fab)‏ من النّاحية النّحوِيّة iLa‏ فاعلاً أو مفعولا أو نعنًا أو 


EU" 


A c 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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(Semantic analysis) gyi التحليل‎ -f£,! 
عديدةٌ» أدناها تحديد دلالة الكلمة في سياقها (كأن 3555 دلالة‎ Sle yo GYS وللتّحليل‎ 
SAT INI كلمة «عين» على الجارحة أو الجاسوس أو بثر الماء)؛ وقد أولينا اليه التحليل‎ 

خاصّة - في مواضع itd‏ من فصول هذا الكتاب - نظرًا لأهمّيتها مع Lal‏ الأقل انجارًا. 

وتجدرٌ الإشارة إلى Sf‏ التحليل DVI‏ له العديد من الدّرجات oe I‏ مثل: 

«(Word sense Disambiguation - WSD) للكلمة‎ ONS فك الالتباس‎ on 
بمعنى الجارحة. أو بئر الماء» أو الجاسوس...‎ GU ومثال ذلك كلمة «عين» حيث‎ 
Named) الكائنات‎ «A على‎ GSN إلخ. وكمبحث فرعيّ لدلالة الكلمة:‎ 
أو‎ "ORE Éu تأي‎ J ومن أمثلتها كلمة «القاهرة»‎ «(Entity Recognition 
على مدينة القاهرة.‎ e 

m‏ فك التباس .(Anaphora Disambiguation) UU ARAM‏ ومن أمثلة 
ذلك: «أحيّت البنت أختها كثيرًاء فلا قابلتها جرت إليها». وموضع الالتباس 
UT‏ نجد صُعُوبة في معرفة as‏ الذي جرى إلى مَنْء هل البنت إلى أختها؟ el‏ 
c MI‏ إلى Seas!‏ وغوز أن تسمية ID‏ الغاس Goal‏ 

* تحليل الإلماحات (Mention analysis)‏ ومثال ذلك «قابل هشام (Wok‏ فقال 
له: «موعدنا غدًا يا هشام» فرد قائلاً: «بل بعد غد). مَن قال ماذا؟ 

m‏ فك الالتباس البلاغى (Rhetoric Disambiguation)‏ : ومثاله «رأيت أسودًا 

Ms جر ا‎ Cal yt القضد‎ a à 


m‏ الفصل بين الموضوعات .(Subject separation)‏ ففي أحيان كثيرة تتناول 
المقالة أكثر من موضوع ولا نجدٌ بالضرورة عناوين فرعية للفصل بين 
الموضوعات الجزئية. نعم؛ يمكن أن يكون كل موضوع له فقرات منفصلة» 
ولكن عدد فقرات كل موضوع مختلف ولا يفصل بينها عنوان فرعيّ. AS‏ 
يمكن أن نفصل بين الموضوعات الجزئية؟ إن هذا الفصل يكون ضروريا عند 
استرجاع المعلومات المفيدة؛ فلو أمكن الإشارة إلى موضع المعلومة المفيدة في 
المقالة أو الكتاب بشكل دقيق» فإن ذلك يوفر على الباحثين الكثير من الوقت. 


لات 


ne aoe we eo A‏ ا 
Uca La < a pall‏ وا |2 OB LA Nd ea oem‏ :هذا JES cs eM‏ 
درجة حسم ضعيفة للغاية لكثير من الغايات المطلوبة من الحاسوب. 


١و‏ - التحليل ا محجمي (Cental analysis)‏ 
zu‏ في هذا المستوى تعيين CON‏ المحجم gn‏ وتوصيفهاء على التحو الي 
i jal oS‏ مبان Bl‏ ومعانيها . ويجمعٌ هذا الُستوى بين مُستويات التّحليل 
EN‏ السّابقة؛ حيث يعنى Jill‏ الفونولوجي d‏ معلومات بطق tolo jill‏ 
libs‏ اليس eal‏ خاصّة في المعاجم oll‏ جيه cas eb pal‏ ويُعنى بالتحليل G‏ 
بمدف استخلاص الوحدات الأساسيّة للمُعجم [المباني]؛ ويُعنى بالتحليل Gees I‏ في 
الاستدلال على سياقات Galea colo all‏ الوظيفيّة؛ ويُعنى كذلكٌ بالتّحليل IVI‏ 
في الاستدلال على المعاني المعجميّة. 
G‏ عن إشكاليّة JE‏ بين هذه المستويات» فنستطيع أن ES‏ من خلال التقاط 
التالية: 
* يتداخل مستوى التّحليل الفونولوجي مع مستوى التحليل FBI‏ حيث 
تشع Spall QUSI QUEM inh‏ أن d pend‏ رات كتليل Mee rl‏ 
بين التحليل Pree)‏ والتحليل es Gall‏ وجود ظاهرة الإعراب 
في o ed - dole - klai ol Yı ll‏ تشكيل tham‏ بعلامات الضبط 
(الحركات القصيرة والسَّدَّة والتنوين) - باستثناء حالة التنوين بالفتح؛ 
of bet,‏ التشكيل bY‏ لبس الصرف cou‏ يُرِيلُه الحسمٌ BBN‏ 
ومثال ذلك: كلمة «قال» بعد تشكيلها يظل الالتباس (SE‏ هل هي من جذر 
«ق ول» من القول» أم من جذر «ق ي ل» من «النوم وقت القيلولة». OS)‏ يجوز 
أن نقول بلغة هل الرياضيّات: إن إزالة الالتباس الفونولوجي شرط ضروريٌ 
ولكنه غير كاف لإزالة الالتباس الصرفي؛ مع العلم بأن التحليل الفونولوجي 
معني أيضًا بمسائل لها Be‏ بنطق الكلمات؛ ويدخل في مباحثه الحروف غير 
المنطوقة والحروف المدغمة وما يحدث في حالات التقاء الساكنين... إلخ. 


vi 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
mn—————‏ 


وكمثال للحروف غير المنطوقةء الألف بعد الواو في «خحرجوا»؛ فإن الألف لا 
تنطق Bee Msn s‏ لام Cà all‏ في «الشجرة)؛ حيث ead‏ اللام 
ف AB y coe‏ الشين SSL‏ 
* يتداخل مستوى التحليل الفونولوجي مع مستوى التحليل oS yell‏ ونلاحظ 
هذا في الارتباط الوثيق بين التشكيل الكامل للكلمة العربيّة ane ly‏ 
Gey‏ التاتج عن التحليل ped‏ للجُملة. 
ucl c ee‏ 
إلا آنا ندعو - عند AGE‏ مع اللّغة العربيّة - إلى الرّبط بين هذين المستويين رياضيًا 
oy‏ الأصل في النحو أن يكونٌ فرع المعنى. 


GLA SU تواجه تقنيات‎ d tel - Y 
جلت‎ ll للتغليد أو الاك‎ ALG ne قا‎ OLS Bde ع ر‎ GU QUI 
مع أخيك أو جارك وتسامرت معه لساعات طويلة فلا تكاد تمر - عبر آلاف الكلمات‎ 
فإنه يتجاوز‎ /٠٠١ المتدفقة من فمه - كلمة لا تفهمها. فنسبة ما تفهمه إذا لم يكن‎ 
(ee IG CS) أفضل أنظمة التعرف على الكلام في الكلام التلقائي‎ ee. 74,۹ 
في نشرات الأخبار)؛ فقد‎ S) وقد تزداد إذا كان الكلام منتظم)‎ LV قد لا تتجاوز‎ 
وجدنا‎ /A* وبين‎ /49 , ٩ تصل في هذه الحالة إلى أكثر من * 7 بقليل). فإذا قارا بين‎ 
وأنه لم يبق إلا القليل. وني الحقيقة يتطلب تحقيق‎ ie للوهلة الأولى أن هذا شيء عظيم‎ 
باستخدام الآلة سنوات من البحث والعمل» وقد لا ندرك بعد سنين طويلة من‎ ٠ 

الأبحاث إلا زيادة /١‏ أو LN‏ 

أريدك أن تقارن بين نسبة الخطأ عند الإنسان وعند الآلة» فنسبة أخطاء فهم الكلام 
عند الإنسان في نفس الظروف أقل من ١‏ و 2/٠‏ أي أقل من كلمة من كل ads ٠٠٠١‏ 
بينم يخطئ الحاسوب في فهم كلمة من كل ٠١‏ أو في أحسن الأحوال ٠١‏ كلمة. لو أن 
الجملة العربية تحتوي على ٠١‏ كلمة فإن الحاسوب سيخطئ في المتوسط في كلمة أو 
كلمتين في كل Xe‏ وربا تكون هذه هي أهم كلمة في الجملة» أو ربا تعرف على الكلمة 
بكلمة أخرى تغير المعنى وتبدله. 


-YY- 


الذي أود توضيحه أننا معذورون في عدم قدرتنا على اللحاق بمقدرة الإنسان ولو 
بعد حين. 

في عام ١٠٠۲م‏ في أحد المؤتمرات الدولية لأبحاث وتقنيات الصوت Inter-)‏ 
«(Speech 2000, Istanbul-Turkey‏ سال أحد مدراء المؤتمر في aoli‏ سؤالاً مفتوحًا 
وطلب من الحضور الإجابة؛ هل بعد ٠١‏ سنة من ذلك الوقت يمكن أن نعتمد على 
الحاسوب في فهم الكلام Ee‏ يجعل الإنسان يعتمد عليه TOES‏ وكان إجماع شيوخ العلم 
وأساطينه باستحالة ذلك. فقد انقطع ol‏ العلماء الذين قضوا ٠١‏ سنة أو تزيد في تقنيات 
الصوت في الوصول إلى شيء يقارب الإنسان» ولكن لم ينقطع الأمل في إنجاز مهام 
محددة» لكلماتٍ محدودة في مجحالات تخصصية محددة؛ بحيث نخاطب الآلة (الحاسوب أو 
التقّال) في جو هادئ وبشكل منتظم وبلغة صحيحة؛ أما أن نتعامل مع (SUV‏ نتعامل 
مع بعضنا Len‏ فهذا على قدر علمنا في هذا الزمن من المحال | ولعل الله الذي تكرم 
بالبيان يتكرم بالعلم الذي يمكن الإنسان أكثر وأكثر. 

حين قارن العلماء بين ما تم إنفاقه على أبحاث التعرف على الكلام وما تم إنفاقه على 
أبحاث الأشعة في الطب في الثانينيات من القرن العشرين» كان الإنفاق على الأبحاث 
متقاربًا وكانت النتائج أيضًا متقاربة» إذ قاربت النتائج في الحالتين AA‏ كنسبة نجاح. 
ولكن شتان بين التأثيرين؛ ففى Sle‏ الطب لا تكاد A‏ مستشفى ولا مستوصفا إلا فيه 
جهاز أو أكثر للأشعة» و كذلك بالنسبة للكلام» لأن 4 هي بداية الرضا 
الحقيقي» وما دون ذلك يصعب انتشاره وقبوله» ناهيك عن LM‏ 

والسبب - كما ذكرنا ul - WL‏ نملك أجهزة نطق وتحليل للكلام غير قابلة 
للمقارنة» فمن العسير جدا مضاهاة أذن الإنسان» حتى Le‏ عدد من الأخطاء أكثر 
بعشر مرات من نسبته عند الإنسان )9 ,8 CZ‏ والتي تكاد تكون مرجع قدرة الإنسان 
الراقية جدا في هذا المجال. سبحان من GLE‏ فسوّى 5 538 فهدى. 

ومع اننا استعرضنا في هذا الفصل تقنية التعرف على الكلام مع مقارنة قدرة 
الحاسوب مع قدرة الإنسان OB‏ كثيرًا من التقنيات يتفاوت رضا الإنسان عنه» بين أن 
يكون كاملاً أو ما يقارب الوضع مع تقنية التعرف على الكلام. 


3 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n——————‏ 


oldest - Y‏ التى تواجه معالحة اللغة العربية 


للغة العربيّة العديد من السمات التي Le BE‏ ومع Of‏ هذه LEN‏ قد pele JE‏ 
FELT Wags‏ في الوقت ذاته عناصر AE‏ إذا ما أردنا إخضاعها للحوسبة. 


LLU هذا المحور بعص التّحدّيات التي تواجهنا عند إخضاع العربية‎ G3) sy 
الحاسوبيّة - من خلال الثقاط التالية:‎ 


-١ , Y‏ الكتابة العربية 
* الكتابة العربية لا تفهم إلا إذا كانت حروفها متصلة» كا في هذا الكتاب: 


= هناك ck ol oe‏ الى a V‏ صا آذ ها وين جاو راا من 
اروف في نفس الكلمة مسافة قصيرة نسبيًا. والواقمٌ أنَّ فصل الكلمات 
بعضها عن بعض مسألة ليست بسيطة. ففي أنظمة تجارية لبرامج التعرف 
غل ded dy all By AI‏ أن د قارب ella epa ZV‏ عل حشري 
الكليات» يكون أصل الخطأ فيها خطأ فى فصل الكلات بخضهاعن (uni‏ 
هذا اذا كانت الوثيقة واضحة. 
- الكلمة العربية - والتي يجب أن تكتب فيها الكثير من الحروف متصلة 
ببعضها - uL Jad‏ التعرف على حروف هذه الكلمات مسألة أكثر 
صعوبة من التعرف على النصوص المكتوبة في اللغات اللاتينية» حيث يمكن 
أن تكتب جميع حروفها بطريقة مُنفصلة عن بعضها البعض (وهو الغالب في 
الطباعة). وذلك يضيف تحديًا آخر أمام تقنية تحويل الكلام العربي المطبوع 
إلى نصوص مقروءة. وسوف نتعرف على ذلك بالتفصيل في الباب الخامس 
عشر من هذا الكتاب. 
٠‏ أساء الأعلام والكائنات j J (Named Entities)‏ في اللغة العربية» lew‏ 
في بعض اللغات تيز بحروف كبيرة في الرسم (Capital letters)‏ . مثال ذلك 
«زرت القاهرة» مقابلها UL .)1 have visited Cairo)‏ وجود هذه العلامة 
الإضافية في الكتابة ترفع نسبة التعرف على «(al‏ الكائنات Name Entity) ÚT‏ 
«(Recognition‏ وهذه كثيرًا ما تستدعي في مجال محركات البحث» إذ لا يكون 


EI 


الاستفسار عن الكلمات العادية» ولكن عن BUGS‏ اسميّة سواء أكانت 
أشخاصا أم أحداثا el‏ مؤسسات....إلخ. 

* غياب التشكيل عند بنية الكلمة أو نايتها. فقد Skel‏ العرب في glare‏ كتاباتهم 
تشكيلاً جزئيًا old‏ الفعل المبني للمجهول من الفعل المبني للمعلوم مثلا أو 
لبيان التشديد في الكلمات التي يغير فيها التشديد المعني... إلخ. وهذا يدع لنا 
الكلمة العربية من وجهة النظر الحاسوبية IS‏ كبيرًا؛ فكلمة مثل عين يمكن أن 
تكون:- ase‏ أو te‏ أو He‏ ..الخ. التشكيل في الحقيقة يمثل جزءً ضروريًا من 
حقيقة الكلمة العربية» إذ إنه يمثل الحر كات القصيرة cally (Short vowels)‏ 
عادة ما تكتب في لغات أخرى كالإنجليزية والفرنسية.... إلخ. إذ يترك للقارئ 
العربي استنباط مالم يكتب من هذه الحركات أو التشديد أو التنوين لبداهته» 
وإذا كان العقل البشري قادرًا على الحسم بيسر وسهولة في قريب من /.٠٠١‏ 
من الحالات» فإن الأمر بالنسبة للحاسوب ليس بنفس السهولة. 

هذا الأمر يسهل الكتابة العربية؛ فمتوسط عدد حروف الكلمة العربية المكتوبة يزيد 

قليلا من f‏ حروف؛ lee‏ يزيد الأمر في الإنجليزية مثلاً عن ذلك كثيرًا (نظرا لكتابة 
كل شيء تقريباء باستثناء «الكلمات «(function words 3b JI‏ ولكنه يزيد دائرة 
الالتباس عند الحاسوب ويجعل المعالحة الحاسوبية ذات أبعاد أكثر من مثيلاتها في بعض 
LGW! SLU‏ ومن dew‏ اله oT‏ اكت الا eb gis X JJ‏ فلو ةا وف 
i d‏ دون تنقيط لأصبَحّت gs‏ الحاسوب شبة مُستّحيلة. 


Y‏ , 7- الأخطاء الشائعة 


OVE She dy all QU Gb Sy SLU JS aues‏ یچ d‏ راد 
نسبة هذه cela VI‏ منها: 


* المحمزات» خاصة مع الألف eC Fel)‏ فنسبة الأخطاء فيها عالية بين عامة الناس. 
* الحاء والتاء المربوطتان؛ مثال «القاهرة» كثيرًا ما تكتب «القاهره» والعكس 
«ضربه) يمكن أن تكتب Kr‏ 


-Yo- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n——— $5‏ 


e‏ قد Y‏ يكون خطأ ولكن اعتاد fal‏ مصر مثلا عدم استعمال الياء آخر الكلمة 
منقوطة ل لتمييزها عن الألف المقصورة كا في «على» و de?‏ 
هذه الأخطاء الشائعة تضيف للالتباس تحديًا AT‏ إذإِنَ G‏ نظام لتحليل النص 
العربي الخام مثلا أو التشكيل يتطلّب - لكي يكون مقبولاً Éles‏ - التعامل مع 
النصوص العربية المرتبكة في ممزاتها أو هائها وتائها أو يائها وألفها المقصورة. 

* نظرًا لدخول الثقافة الأجنبية بشدة وشيوع الكتابة بهاء فإن IES‏ من النصوص 
(Dadi ana bahebk a’wy)‏ ويقصد الكاتب: Ul oid‏ أحبك كثيرًا». 

٠‏ نظرًا لإهمال التعامل بالعربيّة في المرحلة الجامعية في معظم الجامعات العربيّة 
نجد الكثيرين من خريجي الجامعات تختلط العامية في كتاباتهم بالعربية مثال: 
«معلهش UT‏ كنت فاكر gl‏ هاقدر أجي امبارح ...). 

وأحيانًا نجد أننا نود معرفة آرائهم وأفكارهم فنجد أنه لا بد من محاولة ترجمة مقالاتهم 
كا هى إلى العربية الفصحى .(Modern Standard Arabic- MSA) iatl‏ 


الأخطاء الإملائيّة الشائعةء مثل: 

du‏ -> (شئ - شيى). 

إن شاء الله س (إنشاء الله). 

(QN) به‎ XN 

° ناهيك عن أخطاء المجاء الأخرى» كمن يستعمل الحروف القريبة في النطق 
فيكتب: 
مظاهر -> مضاهر (وهو خلط شائع في الجزيرة العربية والمغرب العربي). 
ذليل س زليل. 
وسيط -> وصيط ... إلخ. 


إلا أن هذا النّوعَ منتشر في كل اللغات الإنسانيّة ويكثر بين متعلمي العربية كلغة 


ثانية. 


ات 


Y‏ - التركيب الصرفي للكلمة العربية 

الكلمة العربية مركبة تركيبًا عميقًا مما يجعلها من اللغات ذات المفردات الكثيرة 
(morphologically rich language)‏ مقارنة بالإنجليز SOFA‏ وسوف نعرض 
في فصول الكتاب لتركيب الكلمة العربية. ولكن ما همنا هنا الإشارة إلى 
حقيقة عدد الكلمات العربية والتي يمكن أن تكون بالملايين» ومع أن الكلمة 
العربية تتكون من عدد محدود جدا من الوحدات المعجّميّة ٠٠٠٠١ ~) (Lexemes)‏ 
٠٠١ od‏ وزن (عدا ما يتفرع منها نتيجة الاعتلال)» -- ۳۰۰ سابق 5 ~ ٥٥١‏ 
لاحق). وهذا في مجموعه لا يتجاوز ٠٠٠١‏ وحدة «CLexemes) ZA‏ فهذه 
ميزة كبيرة جدًا d‏ تستفد منها كثير من التقنيات بالقدر الكافي بعد. وما الصعوبة التي 
يشكلها العدد الكبير من الكلمات في اللغة؟ على سبيل المثال: التعرف على الكلام» هذه 
التقنية تتأثر نتائجها بعدد الكلمات التي تتعامل معها في أي مهمة من مهام هذه التقنية. 
وللعلم» فإنه في مجال الأعمال يكفي في الإنجليزية نحو 54 ألف كلمة لتغطي 194 
من احتياج المتحدث ley‏ يحتاج العربي إلى أكثر من ٠٠١‏ ألف كلمة ليغطي 18 من 
احتياجاته في نفس المجال. 


dy pl تركيب الجملة‎ - ۳ 

* تسمح اللغة العربية بالتقديم والتأخير بين كلاتهاء ولهذه الظاهرة دلالات 
بلاغية وقيمة رائعة. فمثال ذلك: قوله تعالى (oi Ss Ix SU‏ 
[الفاتحة Lo‏ حيث بيد تقديم ILD‏ على «نعبد» الحصر والقصر. وحين يقول 
ربّنا - سبحانه وتعالى يريد الله بكم 2I‏ € [البقرة Ly Ae‏ #الله بريد أن 
Se‏ عليكم4 [التساء [vv‏ فقد اختلفّت دلالة التقديم والتأخير بين الفعل 
والفاعل من آية إلى أخرى. 
ولكن ما تأثير ذلك على الحوسبة اللغوية؟ إنه يزيد من صعوبة LUM‏ النحوية 
والبلاغية للعربية مقارنة بالإنجليزية مثلء by‏ نفس الوقت ل يقدم لنا اللغويون 
مجموعة متكاملة من القواعد التي تحيط بالموضوع وتحسمه إذ إن كثيرًا من الحسم 
يعتمد على الجانب الدلالي» على اعتبار أن النحو فرع المعنى. 


-YV- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
— ييا 


ولا بد من صياغة القواعد اللغوية بطريقة يمكن الاستفادة منها Eagle‏ 
ونضرب لذلك مثالا 

تتبع الصفة الموصوف في العدد والجنس والتعريف (مع وجود أنواع أخرى 
للصفة). cates‏ فالقياس الحاسوبي للعدد والجدس والتعريف (u$‏ وبذلك 
تنجح هذه القاعدة في البرمجة الحاسوبية. lag‏ إذا قلنا إن الخبر هو الذي يتم 
معنى المبتدأ فإننا ربطنا الحسم النحوي بالدلالة وضاع طريق الحسم 
من تحت أقدامنا. إذ إن الدلالة أعلى في سلم الحسم اللغوي من النحو. 

OLE‏ بعض الكلمات تمامًا مع وجودها التقديري: ومثال ذلك أنك تتحدث 
عن «زيد» من الناس ثم تقول: (ودخل إلى الحديقة). أين الفاعل الذي دخل؟ 
تقول إنه لضمير مستتر تقديره هو. قد تكون هذه الظاهرة منتشرة في لغات 
أخرى بيد أنها تزيد التحدي أمام LLU‏ الآلية. 

Lad ol ou‏ عن اا الح ads Salty Rie‏ جل اسك 
es‏ الجملة الإنجليزية لا بد من وجود فعل che‏ وإن اقتضى الأمر استخدم فعل 
مساعد: .(auxiliary verb: verb to be)‏ 

«الجو جميل» المقابل ھا بالإنجليزية .((The weather is beautiful‏ 


إن ذلك يرفع العربية درجة في مرونة استخدامها ويجعلها أرفع وأيسر في 
الاستخدام البشري» ولكنه يوسع دائرة الخيارات غير المحسومة أمامنا عند 
إخضاع الآلة لهذا العمل. 

ومن التحديات التي تواجهنا أن كاتب العربية يستطيع أن يربط بين جملتين 
بحرف الواوء إذ إن كتابته أسهل عليه من كتابة فاصلة أو نقطة؛ لذلك فمتوسط 


طول الحملة العربية أكبر بكثير من متوسط طول الحملة الإنجليزية. وماذا 
يشكل هذا بالنسبة لحوسبة اللغة؟ 


-YA- 


إن طول الجملة يصعب على الحاسوب فهمها فهًا دقيقا. خذ هذا المثال؛ لو أن تقنية 
وصلت لدقة 4٠‏ في المتوسط لمعالحة كل كلمة على حدة» ستكون نسبة الدقة 
P‏ التي ALL‏ من: 
- كلمتين» Bo‏ الجملة 2 (دقة الكلمة)؟ = )49 LAY =C‏ 
ALAN Bs (so -‏ = (دقة الكلمة)ه = )49 C‏ 408-2 
٠٠١ -‏ كلمة» دقة الجملة = (دقة الكلمة) ٠,٠٠۲۷ = Vr‏ / أي Gum‏ 


-o ,*‏ التعامل مع الواقع اللغوي 

فالعربيّة تعاني BEL‏ كبيرًا في السنوات العشرين الأخيرة. وبالتحديد بعد 
انتشار الإنترنت وزيادة نسبة التعليم باللغات الأجنبية في مراحل التعليم قبل الجامعي؛ 
فنحن OYI‏ أمام ظواهر لغوية خطيرة تهدد مستقبل العربية في أرضها. فا الموقف من 
العامية والكتابة بالحروف اللاتينية؟ 

ee ee ee .‏ 
على الأقل فهًا وكتابة. بمعنى أنَّنا لا نريد أن تنتشر أي قواعد للكتابة والقراءة 
إلا قواعد الفصحى. 

* إذا كانت هناك بعض اللهجات» فإننا ندعو إلى Ce EDI‏ بينها؛ وربا Lad‏ عالم 
الإنترنت ذلك ممكنا. ولكن |S‏ سمح الله تال ,3,96 t colel jy «ES‏ 
لاختلاف اللهجات. Op‏ علينا أن x‏ بوُجود لحجاتٍ HAE‏ 9 ولكن. id.‏ 
ذلك في القراءة دون الكتابة. فمثلاً أبحاث نطق النصوص العربية Arabic)‏ 
(Text to Speech‏ لا بد أن تنطق النصوص بالفصحى لا العامية؛ والفصحى 
يفهمها عامة العرب» وذلك OY‏ نشرات الأخبار في معظم القنوات تنطق 
بالفصحى (حتى مع بعض الأخطاء). 


-١‏ يمكن تحديد Bs‏ ا ملة من خلال نسبة IT abl‏ تكون جميع كلماتها صحيحة. 


WA 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
$5 ا 


Ul‏ بالنسبة للتعرف على الكلام من العامة فإننا نجد لزامًا على الباحثين أن 
قد يكون مهما لخدمة عامة الناس في شؤون حياتهم المختلفة. 


3 2 
٤‏ - التعريف بتقنيات اللغات الإنسانية 
GC all pl is‏ الذي شهده العام في ill‏ الأخيرة أثرٌ كب في تطوير أدوات 
مُعاجَة اللغات EHI‏ وتنمية تطبيقاتها التي تزداڈ يوا بعد يوم . وتتفاوت درجات العناية 
بالتقنيات المستخدمة في بناء وتطوير هذه الأدوات بحسب الحاجة إليها ؛ كما تتنوعٌ هذه 


التقنيات بتنوع بيئات العمل فيها . وني ضوء هذاء يُمكن تقسيمٌ تقنيات اللّغات ÉH‏ إلى 
الأقسام المضّحة في الشّكل .)1-١(‏ 


البحث في النُصُوص 2 || dN GAS‏ على الكلام SH‏ على الكتابة المطبوعتلا ‏ تقنية قراءة الكئب 

MIELE الاستجابة الصّوتيّة‎ yh سكف على‎ WELT BA الإجابة الآليّة عن الأسئلة‎ 
e 5, J لغة‎ Bel ne 4 ze 
TET pepe 

ETE 
الأنظمة المتَعَدّمة لاسترجا‎ : 
= 


ió‏ عن الآراء 


gs القياس‎ 


الشكل :۲-١‏ من تقنيات اللغات Ll‏ 


—Y.— 


jad الات غل أن رد‎ lb Geb - 303 of فيال‎ - dota, 
الحديث في المشهور منها في فصول الكتاب اللاحقة.‎ 

(Search Engines) -البحث فى النصوص «محركات البحث)‎ E 

تعد محركات البحث في النصوص أو الوثائق من أكثر التقنيات استخداماء والغرض 
منها استخراج المعلومات المطلوبة للمستخدم» ولعل المحرّكات الأكثر استخداما في 
الوقت الحالي هي تلك التي تُعنى بالبحث عن الوثائق التي تحتوى على كلمات بعينها 
وتسمى الكلمات المفتاحية. ويمكن تقسيم محركات البحث إلى عدة cl gl‏ منها: 

ost *‏ البحث في الوثائق الشّخْصِيّة على الحاسوب الشخصي. 

(Enterprise Search) محرّكات البحث في الوثائق المؤسسيّة‎ e 

web) الإنترنت)‎ Gilly (البحث عن‎ ECM البحث في الوثائق‎ cols o 


(Search 
ويمكن تقسيمها من حيث نوع النصوص إلى:‎ 
عام.‎ ¿œ © 


* وبحث في مجال متخصص» مثل الطب» والقانون»....إلخ. 

وتجدر الإشارة إلى أن البحث في المجالات المتخصصة يحتاج إلى ما Sco‏ بالبحث 
الدلالى أو البحث الأنطولوجى» ويساعد هذا البحث على دقة وسرعة الوصول 
Ua UBL oem de La plana‏ آنا عدت عق كله ol utm af‏ تأ ab gu‏ 
التي تتحدث عن السود أو النمور» أو الضباع.... إلخ. فهذا يعد قصورا في البحث» 
مالم ندعم محركات البحث بمعلومات دلالية لكل كلمة؛ ولا يزال البحث UY‏ 
قاصرًا ونادرًا في اللغة العربيّة. 

كا ظهر - حديثًا - نوع من البحث» يتجاوز النصوص إلى الوسائط المختّلفة 
الأخرى. مثل: 

* البحث في ملفات الصوت. 


Eu 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


* البحث في ملفات المرئيّات. 


,و (Machine Translation) zy ia J‏ 
تعد الترجمة الآلية من التقنيات المهمة» والتى تضاعفت قيمتها بعد ظهور الإنترنت 
ودعت الحاجة للتواصل بلغات مختلفة أو للاستفادة من كنوز معرفية هائلة ولكن 

بلغات أخرى. وللترجمة الآلية مدارس عدة منها: 

* مدرسة الترحة بقواعد وقواميس ثنائية اللغة. 

* مدرسة الترجمة بالاعتاد على مدونة ثنائية اللغة» حيث يوجد في هذا النوع من 
المدوّنات ما يكفي من معلومات لتعليم نماذج رياضية. Shay‏ طريقتان odd‏ 
المدرسة: 
- طريقة التعلم من الأمثلة؛ وتستخدم إذا قلّ حجمٌ المدونة الثناتيّة اللغة. 
- طريقة الترحمة الآلية الإحصائية «(Statistical Machine Translation)‏ 

وهذه تحتاج لمدونات كبيرة جدا قد تصل إلى عدة ملايين من الجمل لكي 
تعطي نتائج ملموسة. وتعد هذه الطريقة هي الأكثر شيوعا بين العاملين في 
حقل الترجمة حديثا. 

* مدرسة الترجمة عبر لغة وسيطة» وقد حدث تطور في هذه المدرسة أيضا وها 
بعض الإنجاز الجدير بالمراجعة والاستفادة منه. وقد خصص باب كامل 
لدراسة هذا الموضوع بالتفصيل في الجزء الثاني من الكتاب. 

وقد استخدم elle‏ هذا التخصص عدة وسائل لقياس جودة الترجمة الآلية؛ Ja‏ 

أشهرها ما o‏ ب: (Jo V‏ أو (BLEU Score)‏ حيث يسجل الإنسان - إذا قام 
بالترجمة بنفسه- أرقاما تصل إلى ۸٠+‏ على هذا المقياس» lez‏ تسجل أفضل محركات 
ONT Res‏ من اللغة العربية للإنجليزية ./0٠-‏ ولازال التقدم متلاحقاء والاهتمام 
العلمي في تزايّد لتحقيق هدف البشرية في تحقيق التواصل بين البشر وتوسعة الاستفادة 
من معارفهم المختلقة للخات: وتتيح حركات الترجمة الآلية الترجمة من وإل الحديد من 


Ee 


لغات العالم. وعلى سبيل المثال: يتيح محرك الترجمة الآلية في جوجل الترجمة بين أكثر من 

5 و ”1- الإجابة الآلية عن الأسئلة (Question Answering)‏ 

تعد الوسيلة الأولى لاكتساب المعرفة هى السؤال في صيغة اللغة الإنسانية التى 
co all y SLY! hao‏ تيل Spel‏ وف المزاد ULE ge Goudy‏ بين 
الوثائق المتاحة على الإنترنت أو في del‏ بيانات مؤسسة من المؤسسات» ثم عمل 
استخلاص للمعلومات بشكل BIS‏ للإجابة عن السؤال ثم وضع هذه الإجابة في 
صيغة لغة السائل الإنسانية. وهذه طريقة مركبة وتحتاج إلى عدد من التقنيات للوصول 
بالإجابة إلى درجة الدّقة المناسبة. ومثل الكثير من تقنيات اللغات الإنسانية» فإن هذه 
التقنية المركبة لا تزال تحتاج إلى مزيد من الجهد وخاصة للغة العربية. ولا تتجاوز 
الأسئلة - في أكثر الأنظمة الخاصّة ذه التّقنية - نطاقًا محدودًا من المعارف. 


(Automated Essay Scoring) للمقال‎ gyi ES -£,t 
نظرًا لصعوبة تقييم الامتحانات والواجبات في مراحل التعليم المختلفة على‎ 
جديدةٌ من الأسئلة التي يستطيع الحاسوب أن يتعامل‎ bl فقد ظهرت‎ cle القائمين‎ 
معها بسهولة» وهى الأسئلة التى ها إجابات محدّدة (مثل: الاختيار من متعدد» تعيين‎ 
وغير ذلك). ومن السّهل إخضاع الحاسوب لتقييم‎ MET 7 الصواب والخطأء‎ 

هذا التوع من الأسئلة بعد إمداده بالإجابات الصّحيحة للأسئلة المدرّجة.. 

إلا أن هذه BIG‏ من الأسئلة لا تختبرٌ مهارات التعبير عند الطلاب؛ لهذا.. ظهرت 
الحاجة إلى تطوير تقنية يمكنها التعامل مع الإجابات الإنشائيّة (كموضوعات التعبير 
وما شابَبّها من أشكال الكتابة الإنشائِيّة)؛ وظهرت بالفعل العديد من الامتحانات 
الدّولية التي dd‏ من هذه التقنية. 

وتقومٌ فكرة التقنية - عمومًا - على اختيار نباذج وعينات من أشكال الإجابة 
الإنشائيّة BLN)‏ والمتوسّطة (ng Fly‏ وتصنيفها بحسب درجة التقييم وأخذ ملامحها 
والاحتفاظ Gl,‏ تعيين الملامح التي E‏ الإجابات الجديدة تمهيدًا لقياس درجة اقتراب 
الإجابة الجديدة من الإجابات المدرّجة في نظام التقييم. وتكمن الصّعُوبة الحقيقيّة في 


E up 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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LAS‏ تعيين الملامح المميزة للإجابات الحديدة وطريقة ة قياسها بإجابات التظام. 


5.ه- التلخيص ay‏ للحيو ص (Automatic text summarization)‏ 
دعت الحاجة العملية إلى هذه التقنية وتزايدت بعد الانفجار المعرفي الحالي والمنتظر 
زيادته مستقبلا. فإذا أمكن التعرف على أهم ما ورد في ورقة بحثية أو كتاب في موضوع 
ماء قبل استقطاع وقت كبير لقراءته بالكامل» فرب يفي الجزء المركز والمختصر بالغرض 

أو يقنع المستخدم لهذه التقنية بقراءة البحث أو الكتاب كاملا لبلوغ الهدف. 


وهذه التقنية طريقتان: 
i .‏ يقة الأول : الاستخلاص (Extraction)‏ وتعتمد على انتقاء الجحمل الأهم 
as diss‏ 
is, fall °‏ الأخرى: التلخيص «(Abstraction)‏ وتعتمد على صياغة جديدة 
مختصرة لنفس المفاهيم. 


i alls‏ يقة الأولى هي الأكثر شيوعًا واستخدامًا is Liat:‏ ة الأخرى ob‏ نجاحاتها في 
نطاقات dont‏ ويزداد Lee Sie VI‏ كلما تقدمت co‏ فهم اللغات الإنسانية. ويدعو 
الطموح والحاجة العلمية والثقافية لدى الإنسان إلى الرّغبة في أن يتمكن يوما ما من 
تلخيص مجموعة من الوثائق في مجال معين وبعض هذه الوثائق بلغات أخرى» بحيث 
zi‏ تقوم محركات التلخيص بتلخيصها جميعا ووضع الخلاصة في بضعة أسطر أو صفحات 
للمستخدم . لااشك أن هذا أمل يضاعف من استفادة البشر من حيطات المعارف الحديثة 
ويزيد من إنجازهم ولكن تحقيقه يحتاج لجهود كبيرة جدًا لنتمكّن من الاقتراب منه. 


M aa, 


واخلاصة: 

أنه لا أحد تملك الحق 
E o. l‏ 

وکل بنى آدم خطاء ... 


pa 


الكل JYI as :۳-١‏ للنصُوص 


Mes 


٤‏ و ٦‏ - تصنيف وتجميع الوثائق 

(Document Classification & Clustering) 

عند استخدام محركات البحث للوصول إلى وثائق مهمة OB‏ الإنسان يحتاج إلى 

الوثائق المشابهة لما اختاره. وذلك يمكن أن يتم بطريقتين: 
" تصنيف الوثائق c «(Document Classification) WI‏ يكون هناك 

تقسيم مسبق للوثائق (كأن تقسم إلى سياسة واقتصاد...الخ) وهناك تصنيفات 
متعارف عليها لدى علم المكتبات» وكذلك تصنيفات فرعية هذه التصنيفات. 
تقسيم مسبق للوثائق. وتستَخدَم هذه الطريقة إذا كانت لدينا مجموعة من 
النصوص أو الوثائق وأردنا عمل تجميعات لأنواع الوثائق المتشابهة. 


وال هدف في الحالتين أن نصل إلى الوثائق المتشابهة. ويتم تصنيف الوثائق وتجميعها 


Ls البريد‎ 
BW" وثائق‎ 


eC‏ الوثائق Gy (Clustering Document) JN!‏ هذه الحالة ليس لدينا 


الوثيقة 1 
الوثيقة 2 


الوثيقة ن 


الشكل :٠-١‏ تصنيف وتجميع الوثائق. 
E z 0 5 n‏ " و مو 0 
في Ib‏ التصنيف الالي: تؤخذ ملامح كل وثيقة 5 332 خصائصها (في شكل 
رياضي) ويتم حساب درجة قرب أو بعد الوثائق من بعضها البعض حسب الملامح» 


-Yo- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—.- 9‏ 


ويتم حساب SUI‏ بين الوثيقة المراد تصنيفها والوثائق المصنفة سلفا (سياسة» 
اقتصاد.... إلخ)» فإلى أي قسم كانت الوثيقة أقرب تصنف على هذا القسم. 

وني حالة تجميع النصوص tole pet E OT‏ يتم حساب قرب الوثائق كلها من 
بعضها البعض» وكل مجموعة منهم تقاربت ملامحها يتم ضمها في مجموعة مستقلة. 

(Opinion Mining) عن الآراء‎ 3)! - V , £ 

من call‏ أن نتعرّفَ على اتجاهات الرأي على مستويات عدة؛ على المستوى السياسي 
لمعرفة ميول الناس إلى أي حزب أو فرد» وعلى المستوى الاقتصادي» كمعرفة Gly‏ 
الناس في منتج جديد» إذ يكون مفيدا للشركة المنتجة أن تعرف رأى المستخدمين له. 
ولكن كيف سيتم تجميع هذه الآراء؟ تقليديا يعم عمل اسغيبانات وتختار gall‏ أو 
العينات بعناية لتمثل رأي القطاع المستهدف من الدراسة....إلخ. 

وتكون عملية اختيار العينة ثم إقناع أفرادها بملء هذه الاستبيانات مجهدة ومكلفة 
جدا. وأصبحت هناك مؤسسات متخصصة في هذا الأمر. ولكن بعد ظهور الإنترنت 
والمدونات (المقالات التي يسمح للآخرين بالتفاعل معها ووضع آرائهم) وشبكات 
التواصل الاجتماعى (Social networking)‏ التى Ax;‏ الناس فيها بحرية ALIS‏ 
عن آرائهم» حتى في البلدان التي لا تكون فيها الحرية كاملة للناس» لأنه يمكن (ls‏ 
استخدام أسماء مستعارة والهروب من الرقابة» أصبحت آراء الناس في كل شيء تقريبا 
متاحة وبكميات هائلة على الإنترنت. لذلك بدأت الحاجة هذه التقنية والتى يكون من 
مكوناتها تجميع ا مواد ذات العلاقة بموضوع الرأي المراد معرفة اتجاهاته کار هذه 
الآراء والخروج باتجاهاتها. 

مثال: لو أن شركة سيارات أنتجت Sus ge‏ جديدًا من السيارات وتريد معرفة آراء 
الناس فيه فبعد تجميع المواد المنشورة على الإنترنت حول هذا الموديل من السيارات 
يمكن للشركة معرفة رأي الناس في السعر والجودة وما يعجبهم وما لا يعجبهم من 
صفات وخصائص السيارة الجديدة» ويمكن هذه التقنية أن تستخدم وبشكل مستمر 
لإعطاء مطوري الأعمال في هذه الشركة معلومات قيمة يمكنهم من UAE‏ تحسين 
وتجويد منتجهم بشكل مستمر. 


5 


ويتم بعد تجميع المواد عمل تصنيف ol SU‏ حسب الكلمات المستخدمة. فكلمات 
مثل: (رائعة» وجميلة» ومدهشة....) تعبر عن آراء إيجابية» cS s‏ مثل: (سيئة» غالية 
جداء...) تعبر عن آراء سلبية. طبعا هناك تعقيدات كثيرة للوصول الدقيق للآراء. 

فعلى سبيل المثال: ماذا لو كتب الناس (ليست سيئة» أو ليست جميلة)؛ فورود كلمة 
(جميلة) مسبوقة EL‏ تقلب الإشارة الإيجابيّة في الكلمة إلى إشارة سلبيّة. كل ذلك 
يجب أن يؤخذ في الاعتبار. 


٤‏ و 8- المدقق cs SOY‏ والنحوي. والدلالي 

(Spelling, Syntax and Semantic Checker) 

بعد ظهور الحاسوب JYI‏ الشخصي وانتشاره في الثانينيّات من القرن الماضي 

انتشرت برامج الكتابة عليه مثل: برنامج «MS-WordO»‏ من digas s‏ وقد 
دعت WI‏ إل ظهور SOY ela V) 85 Glee‏ والتحويّة à JY‏ 
ce pal‏ وشاع فى كر من ا OL‏ غل ترب DULL ISU TT‏ 

وهناك Gb ids‏ لإعداد هذه التقنية» منها: 

da s ee °‏ يه 
الكلمة المكتوبة تتطابق مع إحدى كلمات القائمة فهذا 2 يعني tel‏ صحيحة» وإلا 
فإنها كلمة خاطئة ومن ثم ننتقل للخطوة الثانية. 

* نبحث عن أقرب كلمات إلى الكلمة التي تبيّنَ خطأ كتابتها إملائياء فنحضر قائمة 
موجزة من عدد محدود من الكلمات» ثم يتم اختيار أقرب الكلمات باختبار 
السياق de pot)‏ الكلمات في الجوار) وأا كان U‏ أعلى احتمال تم اختيارها بدلا 
من الكلمة الخطأ. 

ue pM كس لک‎ > i vers Jie الإملائي‎ ea والتقدم في تقنية‎ 

بسيطًا «Gl»‏ فاذا لو aS‏ كلمة صحيحةء ES‏ غير مطلوبة في السّياق؟ لو أراد 
الكاتب أن يقول J:‏ ساعده» Jo Ki‏ ساعده).. ol BLÉ‏ كلمة t fon‏ صحيحة 
LESS ÉL‏ ليست صوابًا في السياق. إن اكتشاف هذا p gl‏ من الأخطاء يكون أكثر 
صعوبة. ولكن لا يزال أمام تقنيتي المصحح النحوي والدلالي بعض الوقت للنضج 


ا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n——————‏ 


وعموم الاستخدام بالنسبة للغة العربية» على أن هناك مصححات نحوية متاحة للغات 


أخرى مثل الإنجليزية. المصحح الدلالي عموما أصعبهم ولم يصل لدرجة النضج 
الكافية بعد إلا في تخصصات حددة. 


£ و4- تعلّم اللغات بمساعدة الحاسوب 

(Computer-Aided Language Learning) 

إن تعلم اللغات فرع من العلوم يحوز على أكثر من /7١‏ من الجهد التعليمي للتعليم 
قبل الجامعي» وينقسم تعلم اللغات إلى تعلم اللغة الأم وتعلم لغات أخرى كلغات 
ثانية» إذ إن أخطاء كل منها ومُشكلات تعلمه مختلفة. وعموما تتعامل تقنيات المساعدة 
في تعلم اللغات في اكتشاف وتصويب أخطاء: 

* الكتابة الإملائية. 


ا النحو وقواعده. 

* الدلالة (استخدام اللفظ المناسب في المكان المناسب). 

Gal أن هناك تقنيات أخرى مفيدة في مجال تعلم اللغات لما علاقة بتصويب‎ LS 

وكا أسلفنا ني الحديث عن المصحح الإملائي» تُبنى التقنيات على مثل ذاك المنهج. 
والجدير SUL‏ أن التعرف على أخطاء متعلمى العربية كلغة ثانية في الإملاء. 


PE 

5 و ١٠١‏ -القياس (Stylometry) č; bw Yi‏ 
ومن التطبيقات والتقنيات اللطيفة إمكانية التأكد من نسبة مقال أو كتاب لكاتب 
معين له كتب أو مقالات أخرىء أو ما يُطلّق عليه (القياس الأسلوي). والتقنية لا تعدو 
أن تكون فرعا من تصنيف الوثائق الذي أشرنا إليه آنفا. ويمكن الإفادة من هذه التقنية 
في القضايا التي تحتاج إلى توثيق نسبة مقال لكاتبه كا يحدث في نسبة الأولاد لآبائهم. 
فسبحان الله الذي خلقنا متشاءبين ولسنا متطابقين حتى يحدث التايز بيننا والتعارف» 
ليس ذلك في الجينات والبصمات فقط؛ ولكن أيضا في أسلوب الكتابة. إن الكلمات التي 


EX 


يستخدمها كل منا وتصاريفها وتصاحباتها مع كلمات آخرى» هي للكاتب كالبصمة 


e >s Q 


للبنان. 


الشّكل :5-١‏ القياس الأسلُونّ. 
١١5‏ -التعر AMG‏ على الكلام (Automatic Speech Recognition)‏ 
"TT " apo W‏ 9 
الكلام ‏ هو أفضل طرق التواصل بين البشر. وقد اكتسبت تقنية التعرف على 
الكلام أهميتها من ذلك. وتعد هذه التقنية خطوة : نحو التواصل السهل والمريح بين 
الإنسان والآلة عند نضجها عمليا. 

وتطبيقات هذه التقنية كثيرة ومتنوعة» منها: 

* أنظمة الإملاء «(Dictation Engine)‏ وتستخدم لإملاء مقال أو رسالة 
وتحويلها من صوت إلى نص. 

۰ تستخدم كأداة للإبحار والتجول e‏ 4440 نبي بعض التطبيقات. 
وقد يكون ذلك مهما في مواقف RE‏ مثل إمكانية إدارة مكالمة هاتفية بالكامل 
داخل سيارة وبدون الحاجة إلى البحث عن رقم الماتف بالعين واليد» لأن ذلك 

aa :‏ عن ركم بالعين وال 
يشغل عن قيادة السيارة. فتمكن هذه التقنية المستخدِم من إصدار الأمر بالبحث 


-١‏ يشير (الكلام) إلى الكلام المنطوق» ويُشير CD‏ إلى Sa‏ المكتوب. 


E dm 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
—« ييا 


عن رقم هاتف مُعَيّن فتقوم ody‏ المهمة. |S‏ تمكن هذه التقنية من الوصول لوثيقة 
أو OLS‏ وطلب قراءته» وعندئذ تستدعى تقنية أخرى لقراءة النصوص. 

* تسجيل الاجتماعات وتحويلها Uf‏ إلى محاضر اجتماعات: Spontaneous)‏ 
«(Speech Recognition‏ وإن كانت نتائج هذا التطبيق لا تزال دون المستوى 
المطلوب كثيرا. 


ومع نضج المجتمع الرقمى تتعدد oy‏ الإفادة من تقنيات الصوت وغيره. 
ولكن كيف تعمل هذه التقنية؟ ببساطة Ob‏ كل تقنيات التعرف على الصوت والحروف 
والمتحدث تعمل تقريبا بمبادئ متقاربة. ويوضح الشكل )1-1( كيفية عمل هذه 


£ 


الأنظمة. 


ميكرفون ذبذبات الصوت 
ely‏ نماذج للأنماط 
المختلفة المطلوب 
التعرف عليها 


القرار 


يقرر أي الأنماط 


أقرب 
ر 


الشكل :5-١‏ نموذج ces fle‏ على الأنماط. 


€ , ۲ - تحويل )2 إلى كلام (Text to Speech - TTS)‏ 
7 
ومنها نطق الرسائل عبر UI‏ للإخبار عن خدمة أو إعطاء معلومة... إلخ. وتتكون 
هذه التقنية من تقنيات أخرى» والشكل )۷-١(‏ يبين مكونات تقنية تحويل النص إلى 

كلام العربي. 


—£e- 


d go | الع‎ Normalizer dy ناطق الكلام المشكل‎ 
Arabic Raw ral Jf 


Diacritizer Speech 
Text 


Synthesizer‏ لنصوص طبيعيّة 


الشّكل :۷-١‏ مُكَوّنات تقنية تحويل النص إلى كلام. 


يلاحظ هنا أن العربية تحتاج لمشكل آلي» وهذا الجزء غير مطلوب في اللغات اللاتينية 
حيث تكتب كل الأصوات UE‏ فقط تحتاج إلى بعض القواعد للنطق مثلم| DIS‏ عند 
نطق كلمة آخرها (...tion)‏ 

وبالنسبة لتقنية ناطق الكلام (Speech Synthesizer)‏ لها مدرستان» مدرسة تعتمد 
على تقطيع Sled pill‏ من كمية من الصوت المعد للتدريب إذ يقطع الصوت المسجل إلى 
lel‏ وتُستدعي coa ill‏ المطلوبة في سياقات متشابهة وقت تعليم التقنية سلفاء 
وهذه الطريقة هي الأكثر شيوعا. 

ولكن هناك مدرسة أخرى تعتمد على توليد نماذج رياضية لكل صوت. ويمكن 
تدريب وتعليم هذه النماذج سلفا. المدرسة الأولى يكون الصوت فيها طبيعيا أكثر ولكن 
Gly‏ بعض التقطيع في السلاسة والانسيابية؛ والصوت الناتج عن المدرسة الثانية أكثر 
انسيابية ولا تشعر الأذن فيه بتقطع أجزائه» لكنّه لا يبدو طبيعيًا كالضّوت qid‏ عن 
المدرسة الأولى. وكلا المدرستين تسعى إلى تحسين الأداء بزيادة كمية الصوت المستخدم 
ار 

ولازالت الأبحاث قائمة لزيادة درجة التعبير في الصوت (Expressive Speech)‏ 
حتى يتسنى للمستمع تمييز الاداء المتسم بالفرح أو الحزن أو الفزع أو الغضب ... إلخ. 
كما يمكن jak‏ الاسلوب الخبرى من الاستفهامى ... إلخ. 


ae fx 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


(Audio and Video Search) oi ls OG pall البحث في‎ -١1* و‎ ٤ 
(في مسار الصوت‎ XS js أي البحث عن كلمة أو تعبير في ملفات صوتيّة أو ملفات‎ 
العيد)‎ Le) فيها). هب أننا نريد أن نبحث في ملفات صوتية كثيرة (بالآلاف) عن‎ 
حتى نعرف الآراء المختلفة حول فقه صلاة العيد مثلاء حيث تغنينا هذه التقنية عن‎ 
الاستماع إلى هذا الكم المائل بآذاننا لنصل إلى ما نريد» حيث تقوم التقنية باستعراض كل‎ 
هذا الكم من الصوت وتختار المواضع التي تشتبه في تعبير «صلاة العيد» وتدلنا عليها.‎ 

od y‏ التقنية استخدامات كثيرة منها: 


البحث في الخطب والتسجيلات الصوتية عن موضوعات تهمناء ويمكن أن يتم 
ذلك أيضا في SUM‏ )3( مسار الصوت فيها) لاستخدامات بحثية أو ABUS‏ 
محطات الإذاعة والتلفزيون تحتاجه لإعداد تقارير عن شخصية أو حدث أو مؤسسة 
فتستدعي ما سبق قوله حوطا في تراثها أولا حتى تكون منسجمة مع نفسها في| تعده. 
لأسباب أمنية يتم تسجيل المكالمات الدولية في كثير من دول العالم؛ والاستماع 
إليها يكون شاقا جداء لذلك تستدعى هذه التقنية وتزود بمجموعة من LS‏ 
التى لو وجد بعضها تنبه المعنيين بالأمر للمراجعة الدقيقة (مثال للكلمات: 
خدرات» أفيون» هيروين» أسلحة....). 

ونظرًا لتزايد حجم الصوت SUE My‏ على الإنترنت حاليا ومستقبلاء فإن هذه 
التقنية ستفيد الباحثين عن المحاضرات والخطب» بل والأفلام» وكل المطلوب 
منك هو كتابة عدة كلمات تذكرها من أحاديث من فيها مثلاء فتستدعي أقرب 
هذه الخطب أو الأفلام. 


وتعتمد هذه التقنية أساسا على تقنية التعرف على الكلام» Le]‏ بصورة كاملة أو 


بصورة جزئية. 

وجدير SUL‏ أن كلمات البحث يمكن كذلك أن تكون بالصوت بدل ALS‏ 
وهذا يخدم مستعملي الهواتف النقالة. وكذلك تشمل هذه التقنية البحث في الصور 
فيكفى أن تكتب كلمة «هرم» لتستدعى آلاف الصور التى عوجت من قبل ويظن أن 
بهاصورة«(هرم). 


= - 


(Language Recognition) ali التعرف على‎ -١5 و‎ ٤ 
تزايدت الحاجة إلى هذه التقنية بعد ظهور الإنترنت والانفتاح على كل الثقافات‎ 
على حديث صوتي له صلة‎ (bar واللغات؛ فإذا حصلنا (عند البحث عن موضوع‎ 
بموضوع البحثء وأردنا معرفة لغة المتحدث لنعرف من أي البلاد هو كخطوة أولى‎ 
نحو معرفة ما يقول. إذ نستدعي تقنية التعرف على الكلام المدربة على لغته التي يتحدث‎ 

ac 

هذه التقنية يمكن شرح فكرتها باستدعاء النموذج المشروح في الشكل V)‏ 07( وبدلا 
من أن تكون LIV‏ عبارة عن «US‏ تكون LIE‏ عبارة عن صوت بلغات شتى» 
ويدرب النظام على اللغات التي يراد التعرف عليها. وبعد تكوين الناذج الرياضية 
لأصوات كل لغة يصبح النظام قادرًا على التمييز بينها عندما يتعرض لإحداها. 

ومن الجدير بالذكر أن التعرف على اللغة من النصوص المتاحة أهون بكثير اذ يكفى 
أن نحتفظ بالشائع من كل لغة من BW‏ والتعبيرات لاستخراج لغة المقال الذى نريد 
معرفة لغته. 


-١6 €‏ تعلّم التُطق بمُساعدة الحاسوب 

(Computer-Aided Pronunciation Learning) 

Jd‏ مهارة Ghul‏ أقل المهارات SI‏ نجيدها عبر عملية تعلم اللغات الأجنبية 
بالطرق التقليدية. فكم منا جد صعوبة عندما يحادث Ceol‏ لأول مرة أو يستمع إلى 
نشرة أخبار أجنبية؟ لذلك فإن هذه التقنية مستقبل مهم في تيسير تعلم اللغات. 

ويمكن أن نصنف هذه التقنية كتقنية متشاءهة وغير متطابقة مع تقنية التعرف على 
الكلام. حيث تتفق هاتان التقنيتان في تحليل الصوت واستخلاص خصائصه وبصاته» 
ففي تقنية التعرف على الكلام مطلوب التعرف على الكلمة أو الجملة المنطوقة, BGT‏ 
هذه التقنية فالكلمة أو الجملة محل البحث معروفة سلفاء ولكن المطلوب هو التأكد 
من نطقها نطقا سليها. فعندئذ توضع البدائل المختلفة للنطق» الصحيح منها والخطأء 
وتقوم التقنية بالتعرف على النطق.. هل كان أقرب للنطق الصحيح أو للنطق الخطأً. 
خذ مثالا: لو أن أجنبيا يريد تعلم العربية وليس عنده حرف مثل «الطاء» ويريد أن 


gy 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
—« ييا 


ينطق كلمة «طبيب» la Lb‏ تدرت النظام على كلمتين «طبيب» و (nd‏ فإذا كان 
النطق أقرب ل «تبيب» نعطي تغذية مرجعية للمتعلم بموضع الخطأ ونطلب منه معاودة 
المحاولة وربا نحيله إلى طريقة نطق «الطاء» تفصيليًا. وهكذا يتعلم الأجنبي كيف ينطق 
الحروف والكلات العربية. 

وأهمية هذه التقنية تكمن في أن التدريب عليها يحتاج إلى وقت وصبر طويل قد لا 
يتوافر عند البشر» ولكن الحاسوب ليست لديه مشكلة في ذلك» ولا يمل التكرار الذي 
هو أساس في هذا الموضع. 

ومن أبرز التطبيقات التي ظهرت في هذا المجال تقنية لتعليم أحكام التجويد تحت 
اسم mi‏ وتعد خير مثال كتطبيق نافع في مجال مهم. 
محاكاة للعلاوة 
LJ‏ الدموذجية 


T D) EM 


موافقة لأحكام 
التلاوة 
الشّكل :۸-١‏ تقنية احفص» - تعلّم Gl‏ بمُساعدة الحاسوب. 

V3, 5‏ - التعرف DW‏ على الكتابة المطبوعة (Typewritten OCR)‏ 
تتجه البشرية إلى إتاحة تراثها في شكل رقمي حتى يسهل التعامل معه من استدعاء 
وتلخيص ونطق آلي....إلخ. لذلك نشأت أهمية هذه التقنية. إن كمية الوثائق الحكومية 
وغير الحكومية وكمية الرسائل العلمية التي تعمر مكتبات cols‏ الجامعات في المنطقة 

العربية تحتاج إلى تقنية عالية الجودة لتيسير رقمنة هذه الوثائق. 


—$$— 


وتقوم فكرة تقنية التعرف QI‏ على الكتابة المطبوعة (مع اختلاف الخطوط نوعا 
(lems‏ بمسح ورقات الوثيقة أو الكتاب آليا فيصبح صورة رقمية» ثم تقوم التقنية 
باستخراج الأجزاء من الصورء e den gly‏ صوص مطبوعة ثم تفصل الأسطر ثم 
الكلمات eos)‏ الحروف)ء ويتم التَعرّف على (الحروف GE‏ الكلمات فالجمل فالفقرات» 
والشكل )4-١(‏ ليبين الفكرة الأساسية. 


الشّكل :9-١‏ التَّعدّف JYI‏ على الكتابة المطبوعة. 


AVI Gal - VV £‏ على الكتابة المخطوطة (OCR Handwriting)‏ 
at‏ هذه التقنية سالفتّهاء إلا أن الخطوط اليدوية لها تحدياتها AKES y‏ المختلفة 
نوعا ماعن مُشكلات الكتابة المطبوعة. المشكلة المراد حلها هنا هى نفس المشكلة المراد 
حلها فى ius‏ ارت غل الكعاية Sly cde gall‏ المادة الخدم تريب رارف 
مختلفة كثيرا. ففي حالتنا قد لا تكون الأسطر والحروف منتظمة» حتى لنفس الكاتب 
وفي نفس الوثيقة» حيث يختلف شكل الحرف في كل مرة يكتب فيها de)‏ خلاف الكتابة 

المطبوعة). 

GS o ١4و ٤‏ على اروف 

(Intelligent Character Recognition) 

jab الساقات الفناسة لله ومن قل ذلك‎ cold BUEN Cail oI اتان‎ be 
ظهرت الحاجة‎ «(Tablet computes) الحواسيب الل [التى يمكن الكتابة عليها]‎ 
لثل هذه التقنية لأنَّ الكتابة بالقلم عند عامة الناس أسهل من استخدام لوحة المفاتيح.‎ 
وإذا كان استخدام لوحة المفاتيح في حالة الحاسوب ممكنا لاتساع المكان وطول الدربة»‎ 


—£o- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n————— |‏ 


فإن الكتابة باستخدام لوحة المفاتيح على ال هواتف ÉI‏ أصعب ولذلك تكتسب هذه 
التقنية أهمية أكبر في هذه الحالة. 

تتميز ظروف هذه التقنية بمواصفات مواتية» منها أنه لا توجد ضوضاء كا في 
الصفحات المصورة سواء لكتابة اليد أو الكتابة المطبوعة. LS‏ تتوفر لدينا معلومات أكثر 
عن وضع القلم وترتيب الكتابة قد يكون مفيدا عند التطبيق. وتتفق هذه التقنية مع 
سالفتيها في نفس النموذج المرجعي في الشكل )4-١(‏ الوارد ABT‏ 

M8, 4‏ - تعلّم اط بمُساعدة الحاسوب 

(Computer-Aided Font Learning) 

هذه التقنية تشبه تقنية تعليم النطق السليم للغة أجنبية. فهي تساعد على وزن نسب 
الأطوال والزوايا المختلفة لكتابة الحروف وتراكيبها للغة ما. إن توظيف الحاسوب 
للقيام بهذه المهمة يعد استخدامًا مناسبًا لرفع كفاءة المدارس في تحسين خطوط الطلاب. 
ويمكن بالطبع الانتفاع بها لكل الأعمار ومن سيتعلم اللغة من الأجانب أو العكس عند 
تعلم العربي لكتابة الحروف اللاتينية تينية أو الصينية مثلا. 

M oque P لمرو سس وي‎ 
a تس‎ 

تقنيات مركبه 

(Book Reader) تقنية قراءة الكتب‎ -Y * و‎ ٤ 

UR MUR‏ ينه حيث تُعنى SI‏ على اروف 
sty oe i, - FN‏ و T ERE‏ 
الأخرى بقراءة النصوص من خلال تحويل الت (المكتوب) إلى كلام (منطوق). 


2545 


ELE ER 


على الحروف 


الشّكل :٠١-١‏ تقنية قراءة الكتب. 
-Y¥\,%‏ تقنية التر (Speech to Speech Translation) ay Egil "T‏ 


وهی a‏ مغقدة إل aS dee yo‏ إذ نتكون من RUE‏ التخر EM‏ بالشكل 
(۱۱-۱): 


OY) هة الشَّمَهِيّة‎ us VV) الشكل‎ 


-fv- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
)َُ:6ا — n—U‏ 


CUS i eal أنظمة الاستجابة‎ -77 , ٤ 


(Interactive Voice Response System - IVR) 


كا في OY- JRE‏ فإن تقنيتي التعرف على الكلام ونطق النصوص تستخدمان 
الي Es‏ 


SUE É 5 BN أنظمة الاستجابة‎ :٠١-١ الشّكل‎ 


YY, £‏ تقنية تحويل الكلام إلى لّغة الإشارة والعكس 

(Speech-to-Sign-Language & Sign-Language-to-Speech) 

في هذه الحالة تستخدم قفازات خاصة بها حساسات ترسل إشارات للحاسوب 
بموضع كل pou‏ اليدين. وباستخدام تقنية تحويل إشارات القفازات إلى 
نص» يمكن استخدام تقنية نطق النصوص لتحويلها إلى كلام والعكسء إذ يمكن 
تحويل الكلام إلى إشارات للصم والبكم. فالمتحدث يحول كلامه إلى نص باستخدام 
تقنية التعرف على الكلام» ثم تحول إلى إشارات على شاشة الحاسوب» وهكذا يمكن 
وصل الصم ogame eS‏ فقط نحتاج إلى قفازات مها حساسات وميكروفونات 
وحاسوب أو JU‏ يمكن أن JES‏ عليه التقنيات؛ كا أن هناك جهود بحثية للتعامل مع 
صورة اليدين عبر كاميرا ولكن لا تزال نتائجها دون المستوى التطبيقي. 


À=‏ ةب 


الشّكا icai ٠١-١‏ تحويا Ad‏ الاشارة الى كلام والعكس . 
يه حوب oou]‏ إلى 925« و 


(Dialog management Systems) أنظمة إدارة الجوار‎ - ٤, ٤ 
وتشبه أنظمة التفاعل الصوتي» والتي تحتاج إلى تقنيات التعرف على الكلام ونطق‎ 
ولكن يضاف إليها تقنية عميقة لفهم الكلام وتقنية أخرى لتوليد الكلام. في‎ (ye pall 
لفهم وتوليد الكلام ولكن‎ TVR الواقع هناك طبقة مبسطة ومبرمجة لأنظمة التفاعل الصوتي‎ 
إدارة الحوارات تحتاج لدرجة أعمق لفهم الكلام وتوليد الإجابات. نحتاج إلى محللات‎ 
صرفية ونحوية ودلالية «ومحلل منطقي» لما يقال. هذه الأنظمة ستنقل الآلة لمستويات أعلى‎ 
بكثير من حيث سهولة التفاعل مع الإنسان وحسن توظيف إمكانياتها لخدمته. وسوف‎ 
في ثوبه الحديث» إذ سيكون في مقدور هذه‎ (Robot) (LY! تستخدم بكثافة مع «الإنسان‎ 
الآلة الذكية «الإنسان الآلي» القيام بكثير من الأعمال الروتينية في المنزل والمصنع وخدمة‎ 
ساعة في اليوم دون كلل ولا ملل. بل ربا يكون‎ Y 5 الأطفال وكبار السن والمرضى على مدار‎ 
قادرا على الحكاية والترفيه لإخراج مستخدميه من *مومهم واللعب معهم بذكاء وحضور.‎ 


جراد 
ناطق ^ 
[ze‏ 


الشّكل ٠١-١‏ : أنظمة إدارة الحوار. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ب اا ee‏ 


Yo, ٤‏ — الأنظمة LAM‏ لاسترجاع المعلومات 


(Advanced Information Retrieval Systems) 


لا تكتفي هذه الأنظمة با سترجاع المعلومات المحَرّنة في أوعية المعلومات في صُورَتها 
CAO‏ اعا - “SUIS‏ استرجاع معلوماتٍ EAR‏ من مجموعاتٍ 
تاتون Gilt ll‏ وا ا BLU e‏ ل قدو olla‏ الأنظبة Jo‏ قلخن cols lali‏ 
a‏ ذا غت ااج إلى ets‏ أو gol Rad‏ من لات dale‏ أو استخدام 
أساليب م iiih‏ في عمليّات الاسترجاع» كأن pA‏ الوت SUI BUI Ge‏ أو 
LU aii a‏ كا الكل ذا -0 \( 


ICE 


الشّكل 15-١‏ : الأنظمة المتَقَدّمة لاسترجاع المعلومات. 


—-Or-— 


(Text Mining) التنقيب في النصوص‎ - Y^, £ 
RD من البيانات‎ Sed isle bees Hom هذه التقنية ة إلى‎ a 


D 


oll s à ART e qu‏ نَصَيّة؛ cla gall PW Eos‏ من 
قواعد البيانات؛ وانتهاءً بتقييم التنائج. وتتفرّعٌ عن هذه التّقنية تقنياتٌ أخرى» منها: 

e‏ تحليل المشاعر. 

NON تلخيص وتصنيف وتجميع‎ t 

* التَّقيب عن ANB!‏ 

٠‏ التصحيح الآلى للنصوص. 


i Ei a 

ala E al a 

EE‏ العديدٌ من امسات Sell‏ بحوسبة all‏ والتي تعمل في خدمة تقنيات اللغة 
العربية» ستحاول أن gó ya‏ لبعض هذه الموّسّسات فيا يلي: 

CNET -3,0‏ ذات طابع أكاديمىٌ 

:LDC (Linguistic Data Consortium) مُوّسّسة‎ " 

ie c ee See ce ea‏ المعنِيّة بالموارد 
دعم the Advanced Reh Projects) NT SAN AN dis, cr‏ 
(Agency -ARPA‏ تولي مَوّسّسة LDC‏ عناية ببناء المدّوّنات اللو ci‏ وقواعد 


cà ld & s Xf RI UL‏ وا لاجم I AUI‏ لأغراض eredi‏ والتطوي. 
il *‏ امع ااانا > الر OLY‏ المتحدة ES eV‏ 


http: / /www.ldc.upenn.edu الموقع الإلكترونٌ:‎ ° 


—0\-— 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n———————— 5.‏ 


ru RE . 
Keri بمعجم‎ 5552) Buckwalter ial à all Jen 
-Treebank Arabic العري‎ i ec) البنك‎ - 


E‏ مُعجم اللّغة العربيّة (Ro JE‏ مصر (مُعجم العامية المصريّة). 

العديد من AU! coU SALT‏ للعاميّات العرييّة (في مصر والعراق). 

" فريقٌ البحث في GULLS‏ الطبيعيةء gl OS‏ 9 الحاسوب. ليدز: 
(NLP - School of Computing at the University of Leeds)‏ 


aai Caki oe. علوم الحاسوب في جامعة ليدز‎ ás xd 
HIS, . للباجئينء وتشرف على أطروحاتهم للماجستير والدّكتوراء‎ Cd الدّرجات‎ 
es ضمن أفضل ا ا‎ La 


المشحدة . يعمل فريقٌ البحث في Ls‏ الّغات d STU Cel‏ مشروعات Cy‏ 


مُشتركة» gas‏ عناية خا EEA‏ ا بيه ومواردها Sz X AUI‏ الفريق في 
أبحاثه على o‏ ال dig‏ ات الل ال 


LEE 


* المقرٌ: جامعة ليدز - المملكة المتّحدة. 
* الموقع الإلكترون: 


http: / /www.engineering.leeds.ac.uk /computing /postgraduate / 
research—degrees /projects /natural-language—processing.shtml 


ين rye a leit‏ 
ب Mem‏ 
catal o yal -‏ لأقسام الكلام في اللّغة العربيّة المكتوبة. 
pl J ate cays -‏ في LA‏ الكريم. 
ع jal‏ ا بيه لُصُوص القرآن الكريم. 


—-oY- 


= المتَظّمة dy AUG soll‏ والثقافة والعُلُوم (ألكسو)- إدارة العُلُوم: 
TheArab League Educational, Cultural and Scientific Organization‏ 
—ALECSO‏ 
مع مطلع الألفيّة الثالثة E‏ إدارةٌ العُلُوم بالمتَظّمة dy AU É‏ والثقافة 
p la‏ عنايتها إلى حوسَبةاللّة العربيةء فعقدّت عددًا من المؤتمرات والمحافل Ly‏ 
وأنجرّت - ولا Sie - Jis‏ مشرُوعاتِ ISI LUI due eos‏ للغة diss: e‏ 
مشروعات حوسبة e V ol Bl‏ عددٌ من SA By ns‏ من خلال 
و مل وجو عات Ew‏ كما تتعاون مع El‏ جموعة SLIN oa‏ والهيئات 
Xll‏ بحوسبة il E‏ به در الإشارة إلى عناية ا العربيّة PUT‏ والثقافة 


Gaw أو مفتوحة المصدر‎ iR العربيّة المنجّرّة في صُورةٍ‎ ia بتوفير تقنيات‎ XU 
جوانب القُصُور فيها‎ LL, إلى إتاحتها للباحثين من ناحية» والعمل على تطويرها‎ 
من ناحية أخرى.‎ 
المقرّ: توس.‎ * 
http: / /www.alecso.org الموقع الإلكترونٌ:‎ . 
TET ERAURER oe ° 
«الخليل».‎ à 2l نظام التحليل‎ - 
EI Gal المعجم‎ - 
من المشروعات القائمة:‎ * 
Ep نظام التحليل‎ - 
JI aA “wy Ghali - 
All تشكيل النضوص‎ a - 


—oY- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
SSD‏ 


" مدينة الملك عبد العزيز e lx‏ والتقنية (معهد بُحوث الحاسب): 
(King Abdulaziz City for Science and Technology)‏ 
Be‏ سس eli‏ في عام ۲ لأغراض البحثِ الي تخدم المملكة العربيّة الشعودية 
Ju n‏ والتقنية في Sle‏ تقنية المعلومات. gall TE‏ أربعة أقسام Kale‏ 
هي: : قسم A OG pall‏ ف وقسم الحوسبة العلمية» وقسم النظم والشّبكات» 
وقسم هندسة البرمجيات والأنظمة المبتكرة ُعنى قسم OU sally OU pall‏ بإعداد 
البُحوث والدّراسات وتقديم ال لول أُشكلات حوسبة اللّغة العربيّة كما يقوم بتقديم 
الاستشارات وإقامة المؤتمرات oll,‏ العلميّة المتخصّصة ly gill ix‏ الحادثة 
في ميادين تقنيات BUI‏ والبحث في سبل OSL‏ مع مراكز الأبحاث والتطوير الدولية. 
* المقرّ: مدينة الملك عبد العزيز e xU‏ والتّقنية - الرّياض - المملكة العربيّة 
Hp gaol‏ 
* الموقع الإلكترون: 
http://www.kacst.edu.sa/ar/about/institutes/pages/ce.aspx‏ 
° من الموارد SAU‏ للعرَبيّة: 
ga yrl EM =‏ للأصوات. 
- المقَوّم الآيّ للمقالات العربيّة. 
نظام مُعالجحة G5 LI‏ العربيّة المطبوعة. 
- مجموعة نظم التحليل التحوي للنصوص العربيّة المتاحة على الإنترنت. 
- مدونة عربية نصية كبيرة. 
* من المشروعات القائمة: 
- مشروع بناء نظام تفاعلي Shall‏ على الأصوات العربيّة. 
- مشروع ويكي عربي - لإثراء موسوعة ويكيبيديا العربية. 


عم - 


m‏ مجموعة كولومبيا لنمدّجة اللّهجات É AN‏ ة» جامعة كولومبيا: 
(«Columbia’s Arabic Dialect Modeling Group» CADIM)‏ 
Stew de got‏ رما EY.‏ البحث في مركز أنظمة ed‏ الحاسوبيّة Center for)‏ 
(Computational Learning Systems - -CCLS‏ بجامعة كولومبيا الأمرد pce‏ غت 
JS PME ON]‏ الليجانة العربيّة ویستند إلى Él PU gebe‏ المعاصرة Modern)‏ 
(Standard Arabic -MSA‏ نى iani]‏ مشروعا UN! Vy‏ على Mp‏ 
ye Ein 3 SE Automatic dd Se LM QE -AASR)‏ ا v s$-‏ 


SRG RN ds 
مع اللهجات العربية.‎ 
DEMO Ml دوي‎ Al. ف‎ 
/http://www | .ccls.columbia.edu/~cadim :(j 5 UY! e» è 
ASE مو‎ * 
لتحليل‎ RUE s MADA+TOKAN alll نظام التحليل‎ - 
النصوص العربيّة المكتوبة» ومن مهامّه:‎ 
.(Tokenization) تقطيع الم ص‎ - 
.(Diacritization) (JVI التشكيل‎ - 
.(Morphological Disambiguation) (3 » َك الالتباس‎ - 


mer «(PoS Tagging) تَعبين أقسام الكلام‎ ales - 
.(Lemmatization) و التفر يع‎ (Stemming) 
فريقٌ البحثٍ في مُعالجة اللَعَاتِ الطبيعية باع ستَانْفُوْد:‎ " 
(The Stanford NLP Group) 
IE 0١ aži ١ eran dr 
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slái Jaa‏ معًا على الوارزميات التي نسَح لأجهزة الكمبيوتر بمعالجة وَقَهُم 
Ay aeni‏ 
Ls pdt gall 8‏ الولثيات الخ AS. eV‏ 


http: / /nlp.stanford.edu الموقع الإلکترو:‎ e 
الم وعات:‎ © e 
الآلية.‎ TARY نظام ستانفود‎ - 
لاستنتاج مُدَوّنات اللخات الطبيعية.‎ 35 pili نظام‎ - 
EI coo gl نظام ستانفوزد‎ = 


= مَعْهد Li‏ لِبُحوث (QCRD Lagh‏ 
(Qatar Computing Research Institute)‏ 
5 ره "c Y v oem ^a £5 g o EE‏ 
هو مَعْهد Gd‏ غير ony‏ تأسس كجزءِ من مؤسسة قطر للتربية والعلوم وتنمية 
المجتمع في عام 27١٠١‏ ومن GLa ee‏ التي يركز عليها OES‏ اللغة العربية والحوسبة 
عالية الأداء والمعلوماتية الحيوية. 
e$ - aS SA yall e‏ 
الموقع الإلکترون: http: / /qcri.org.qa‏ 


٠‏ تحديات الممهد في SES SE‏ اللغة العربية: 


< 


- تحدي AA‏ الآلية للغة العربية. 

gd -‏ مُعَلّم GU‏ العربية الإلكترون. 

gá -‏ نظام SSM‏ المستمرّة باللغة العربية. 
ga -‏ المحتوى ESN‏ باللغة العربية. 


-~ot- 


:ESOLE الجمعيّة المصريّة هندسة اللّغة‎ " 
(The Egyptian Society of Language Engineering) 


i 


نشت نكت في عام IK, ۱۹۹١‏ المندسة في جامعة عَين شمسء وتُعنى بحوسبة GÍ‏ 
و الع E‏ رون . تعمل الجمعيّة Úi-‏ لأهدافها المعلّنة - على 
تحقيق التقارب بين الأكاديميّين والباحثين Cn‏ والمنتجين والمستخدمين من ALE‏ 
uu lc‏ 
PU oly ball ile pasty Sal EUR Als Ol oy‏ العو 
مُتابعة التَطَوْر eal olus Med ae 1 o E‏ والأاديمي 
مع الجمعيّات alll‏ المعنيّة بحوسبة اللّغة على المستوى Ga‏ والقومِيٌ والدّو. 


- تسامعة عن شمست القاهرة‎ spall t 


http: / /www.esole-eg.org الموقع الإلكتروني:‎ e 
ين أنشطة الجممية:‎ * 


- عقد Efe‏ سنوي لهندسة AU‏ يناقش ختلف القضايا في حَوسبة اللغة 
Taai‏ 


— عقد ندواتِ وورش عمل للإفادة من خبرات oneal‏ في VE‏ 
TA o SA debe E ^‏ 


ALTEC É JH مركز تقنيات اللغة‎ " 
(Arabic T. Technology Center) 


و 


م dae Y Cl cg.‏ إلى co‏ سس المركز في عام ۲۰۰۹ بدعم من شركاتٍ 
es‏ ومُوّسّساتٍ بحي وأكاديميّة وهدف إلى توفير الموارد CAG BAU‏ بحوسبة 
Gd a‏ من الباحثين والمطوِّينء كا تمدف إلى تنمية اموارد Gl‏ من خلال 
cael‏ عل uri a dE. M. £l ia cade ONE‏ 
بالجامعات والمؤسّسات الأكاديميّة. ويُعنى المركز بتقديم الخدمات BE‏ لذوي 


الاحتياجات LDH‏ من خلال تطوير التفنيات المناسبة لاحتياجاتهم» كا يُعنى بتطوير 
al ial! ples EEN LŽI‏ لكر d‏ طفن Ue‏ 
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pas الجيزة‎ a * 
http: / /www.altec-center.org الموقع الإلكترونٌ:‎ ° 


SES 
عقد مؤتمرات في حوسبة اللغة العَرَييّة وتقنياتها.‎ - 
إنجاز مجموعة من الأنظمة والموارد اللغوية للباحثين والمطورين.‎ - 
ACAD ين المواود اللكوكة‎ * 
مجموعة ضخمة من قواعد البيانات المستخدّمة في التَعرّف على اروف‎ - 
صفحة)‎ ٠٤١١١ - على‎ og gt) e pa سواءٌ أكائت عسو حة‎ - xa al 
(on-line 4 às مكتوبة باليد (كتابه لآلف كاتب‎ el 
3 Ger 2$ s 3 aT GH 
Ef أنجرّت باستخدام آليّة‎ [EN مضبوطة بالشّكل‎ d d uis - 
الْعَرَبِيّكَ وكذلك تحشاة بأساء الكائنات ويصل حجم‎ oe pa UN! 
المدونة إلى “املايين كلمة.‎ 


ه, ۲- شر كات مهتمة بحوسبة اللغة 

ودر الإشارة lids‏ — إل وجرد العديد من AN‏ كات ال رة Gil‏ 
منها - على سبيل المثال لا الختصر: 
" شركة «آي بي Mel‏ 

(IBM (International Business Machines Corporation 


SI e‏ نيويورك - الولايات المتجدة. 


http: / /www.ibm.com الموقع الإلكترونّ:‎ * 


" شركة «مایکروسوفت» Microsoft‏ : 
* امقر الرئيس:واشنطن - الولايات التّحِدة. 
° الموقع الإلكترونٌ: http: / /www.microsoft.com‏ 
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:Sakhr Software - Arabic Language Technology ( 2-2? åS شر‎ " 


المقرٌ الرّئيس: القاهرة - مصر. 
s‏ الموقع الإلكتروقٌ: http: / /www.sakhr.com‏ 
ote ge Aa à w‏ > 
o"‏ الشركة الهندسية لتطوير النظم الرقمية «أر دي اي): 
(RDI (The Engineering Company for Digital Systems Development‏ 


المقرّ الرّئيس: الجيزة - مصر. 
s‏ الموقع الإلكترونٌ: http: / /www.rdi-eg.com‏ 


Fu £e le n أفكاڙ‎ -٦ 
التقنيات التي قُدّمَت في حوسبة اللّغة عمومًا وحوسبة‎ wal إعداد دراسة عن‎ -١ 
اللغة العربيّة على وجه الخُصوص.‎ 
؟- إعداد دراسةٍ عن أهم التطبيقات هذه التقنيات في حياة الناس.‎ 


DEN البحث في مستقبل هذه التقنيات والتطبيقات وخاصة في عصر الهواتف‎ - Y 
المعالجات اللغوية.‎ OUST وما قد يتطلبه ذلك من إعادة النظر في‎ 
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الفصل الثاني 
التحليل الصوتيٌ 


(الدّراسة التحليليّة للصّوت Sool‏ 2 العصر الحديث) 
د. أحمد راغب 


١‏ - تحليل الصّوت اللّغويٌ. 


؟- آليات التنفيذ» وإعداد قاعدة البيانات الصوتية. 
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مدخل 

يقوم هذا الفصل على تقديم دراسة تحليليّة للصوت اللغوي» وذلك من خلال 
الاتكاء على نتائج التحليل التقني لأصوات اللغةء إلا أن تلك الدراسة لم تكن منبتة 
الصلة عن جهود elle‏ العربية الذين قدموا وصفًا تفصيلا لأصوات اللغة العربية بغية 
الحفاظ على النطق العربي من اللحن أو التبديل؛ فلقد كانت «جهود elde‏ العربية مثل 
الخليل وسيبويّه وان جني في دراسة الأصوات اللّغوية يشار إليها دائ في عصرنا على 
أنها من الإنجازات المتميزة في الدرس اللغوي» وقامت حوها دراسات ليست قليلة». 

وسوف يقومٌ LOU‏ في هذه الفصل بمعالجة الدراسة التحليلية للصوت اللغوي 
من خلال محورين رئيسين: 

١‏ - أوهما يتناول تحليل الصوت اللغوي. 

؟- والآخر يتناول آليات التنفيذ» وإعداد قاعدة البيانات الصوتية. 


-١‏ تحليل الصوت اللغوي 

e» sai - Y, À‏ اللغوي 

ذهب الراغب الأصفهاني إلى أن «الصوت: el gbl‏ المنضغط عن قرع جسمين» وهما 
ضربان:صوت مجرد عن تنفس بشيء كالصوت الممتد» وتنفس بصوت ما. 

والمتنفس نوعان: غير اختياري كما يكون من SIAN‏ والحيوانات» ونوع اختياري 
كما يكون من الإنسان» وهو ضربان: 

° ضرب باليد كصوت العود وما يجري ججراه. 

° ضرب بالفم في نطق وغير نطق. 

فالمنطوق منه: إما مفرد من الكلام» وإما مركب كأحد الأنواع من الكلام. وغير 
النطق : كصوت الناي». 


وذهب ابن سينا إلى أن «الصوت تموج ol gl‏ ودفعه بقوة وسرعة من أي سبب كان». 


-10- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


أما ابن جني فقد ذهب إلى أن الصوت اللغوي «عرض يخرج مع النفس مستطيلاً متصلا 
حتى يعرض له في الحلق والفم والشفتين مقاطع تثنيه عن امتداده واستطالته» فيسمى 
المقطع lal‏ عرض له حرفاء وتختلف أجراس الحروف بحسب اختلاف مقاطعها). 

«وقد ثبت Cele‏ أن الصوت اهتزازات محسوسة في موجات col gl‏ تنطلق من جهة 
الصوت» وتذبذب من مصانعه المصدّرة له» فتسبح في الفضاء حتى تتلاشى» يستقر 
الجزء SV‏ منها في السمع بحسب درجة تذبذبهاء فتوحي بدلائلهاء فرحًا أو حزتاء Ge‏ 
أو dl‏ خبرًا أو إنشاءً» صدى أو موسيقىء أو شيئًا Gole‏ مما يفسره التشابك العصبى في 
الدماغ» أو يترجمه الحس المتوافر في أجهزة ا مخ بكل دقائقها». وتتم عملية إنتاج الصوت 
عبر ما يعرف بالجهاز النطقي «الذي يتمثل في «الرئتين ولسان المزمار والرقيقتين أو 
الان Vy cad pall‏ راف al el‏ 

فالصوت يمثل الصورة الواقعية للغة التي يرى «دي سوسير» آنا «كيان عام يضم 
النشاط اللغوي الإنساني» في صورة ثقافة منطوقة أو مكتوبة» معاصرة أو dA gia‏ 
وبعبارة أخرى كل ما يمكن أن يدخل في نطاق النشاط اللغوي من رمز صوتي أو كتابي 
أو إشارة أو اصطلاح فهو من قبيل CRU‏ التي إما أن تكون في صورة منظمة ذات 
قواعد وقوانين» وذات وجود اجتماعى فيطلق عليها اللسان» وهى اللغة المعينة التى 
s‏ مو شرع loll fu doa‏ الاتكلبوية وإنا 8T‏ كرون ات ضور عاية فى 
العقل الجمعي ويطلق عليها اللغة». 

وني المعجم الوسيط: «الصوت كل ما يسمع» وسببه تموج الهواء نتيجة لقرع أو قلع 
أو (LA pos‏ [مادّة: ص Loy‏ ويرى الدكتور محمد أحمد كاملء في كتابه (العلوم وحياة 
الإنسان) أن «الإحساس في الأذن بالطاقة الميكانيكية الناتجة من اهتزاز الأجسام في 
dle‏ التردد من ٠١‏ إلى 7٠٠٠٠١‏ ذبذبة في الثانية» ويصدر الصوت عند اهتزاز الأجسام 
نتيجة لتأثرها بالطاقة الحركية أو المغناطيسية أو الكهربية مثل الشوكة الرنانة أو الآللات 
الموسيقية» أو اهتزاز الثنايا الصوتية بالحنجرة أو الجرس الكهربي» وتنتقل الموجات 
الصوتية في الوسط المحيط بالجسم SAU)‏ مثلا) في صورة كرات من الانضغاط (تتقارب 
الجزيئات من بعضها) تتبعها كرات من التخلخل (تتباعد الجزيتات عن بعضها)» 
وتتكون الموجه الواحدة أو الذبذبة من انضغاط كامل + تخلخل كامل» ويعتبر طول 


- 


الموجة Wavelength‏ هو طول الذبذبة الواحدة» أو هو المسافة بين مر كزين متضاغطين 
متتاليين أو مركزين متخلخلين متتاليين» . 

(Speed of sound) الصوت‎ ås w- Y, ١ 

هي سرعة انتقال الطاقة الصوتية في الوسطء وهي ثابتة في الوسط الواحد بصرف 
النظر عن نوع الصوت وتردده» ولكنها تختلف من وسط إلى آخر فتتغيّر طبقا لكثافة 
الوسط وإعاقته للصوت ودرجة الحرارة» وخصائص الوسط التى تحدد سرعة الصوت 
هي الكثافة وقابلية الانضغاطء والكثافة هي مقدار الكتلة الموجودة في وحدة الحجم 
من المادة» وتقيس قابلية الانضغاط مدى سهولة كبس المادة في حيز ضيق. 5 US‏ زادت 
BES‏ وزادت ALE‏ الانضغاط» قلت سرعة الصوت. وتزداد سرعة الصوت في 
السوائل عن الغازات وني الأجسام الصلبة عن السوائل؛ وذلك لتقارب الجزيئات بهاء 
فالسوائل والأجسام الصلبة بصفة عامة أكثر BUS‏ من cel gl‏ وهي أيضًا أقل من المواء 
بكثير في قابلية الانضغاط. UU,‏ فإن الصوت ينتقل بسرعة أكبر خلال السوائل 
والأجسام الصلبة. 


(Sound wave) الموجة الصوتية‎ -Y , Y 
هى أحد أشكال انتقال الطاقة» وتتحرك الموجات في وسط مادي“ حيث تنتقل فيه‎ 
الوسط بشكل دائم» أي‎ ct joe iol] pda jT lf الطافة دن كان‎ Jic abe gl 
مع انتقال الموجة» ولكن جزيئات الوسط تتحرك بشكل متعامد‎ ALS أنه لا تنتقل أي‎ 
أو مواز لاتجاه حركة الموجة حول موقع ثابت. وللموجات صفة الدورية» فتكون عادة‎ 
تكرارا لنمط ما من الشدة في فترات زمنية متتابعة» ويسمى عدد الموجات المارة في مقطع‎ 
ما مقسوما على وحدة الزمن التردد. وتسمى المسافة الأفقية التي تقطعها الموجة الواحدة‎ 
طول الموجة؛ وهو أصغر جزء متكرر مكون للموجات» ويساوي المسافة بين قمتين أو‎ 
قيم صفرية متتابعة للموجة» ويوضح‎ Y قعرين متتابعين» أو هو المسافة المحصورة بين‎ 

الشكل )١-7(‏ رسما تخطيطيا لطول الموجة. 


-١‏ باستثناء الموجات الكهرومغناطيسية وبعض أشكال الجزيئات الكمّية ذات الخصائص الموجية. 
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طم طول الموجة 
3 المطال 


جا 


لال 


>——— إلمسافة 
الشكل 1-7: رسم تخطيطي لطول الموجة. 

وصفة الدورية للموجة عبارة عن التردد أو التواتر» وهو مقدار تكرر الموجة الواحدة 
ذات الطول الموجي المتفق عليه في كل وحدة زمن. 

وتكون درجة الصوت أعلى كلما كانت الذبذبات أسرعء Ss‏ زادت سرعة هذه 
الذبذبات كان الصوت دقيقا أو Ble‏ ومن ثم فإن الصوت يكون سميكًا إذا قل 
عدد الذبذبات في الثانية الواحدة. «فالفرق بين شوكة رنانة ذات درجة صوتية عالية 
وأخرى ذات درجة صوتية منخفضة أن الأولى تعمل عددًا أكبر من الذبذبات في الثانية 
الواحدة». ويقاس التردد بعدد الذبذبات التي تحدث في الثانية الواحدة». 

وإذا كان تردد الصوت “(Sound Frequency)‏ هو عدد الذبذبات أو الموجات 
الكاملة في الثانية الواحدة فإنه يمكننا رصد هذا التردد كما في الشكل (Y-Y)‏ الذي 
يعرض لموجة صوتية ذات تردد مرتفع وأخرى ذات تردد منخفض. 


TARA A we 9‏ حي حم | لضغط 
إحدورة حم 

الوقت الضغط 
ج دورة م 


الشّكل YY‏ موجة صوتية ذات تردد مرتفع (صوت رفيع) وموجة صوتية ذات تردد منخفض 
(صوت غليظ). 


١‏ - وحدة تردد الصوت هى هيرتز Hertz)‏ أو Hz‏ أو ذبذبة/ ثانية). 


-/- 


ونلاحظ هنا أن التردد يتناسب عكسيا مع طول الموجة» أي كلما زاد التردد قصر 
طول ide ll‏ أي: التردد 1٠٠١‏ هرتز له طول موجة أقصر من التردد ٠٠١‏ هرتز. 

ويعتبر التردد من العناصر التى تؤدي إلى إدراك بعض الأصوات وقييزها؛ حيث 
«يؤدي اختلاف تردد موجات بعض الأصوات اللغوية إلى تغير في إدراكهاء فالصوت 
/ س/ ذو تردد عال يفوق 5٠0٠١‏ هرتز» فإذا انخفض تردده ليقترب من 70٠١‏ هرتز 
OB‏ السامع يدركه / ش/). 

ويمكن رصد العلاقة بين التردد والشدة من خلال الشكل (Y-Y)‏ الذي يعرض 
رسا تخطيطيا لرصد العلاقة بين التردد والشدة لموجة مفردة. 

الشدة 


التردد 
الشّكل Y-Y‏ رسم تخطيطي يرصد العلاقة بين التردد والشدة لموجة مفردة. 
١و٠‏ -التردد الأساسى 
هو أحد العوامل التي «يمكن عن طريقها إنتاج أصوات يختلف الواحد منها عن 
OSV‏ وحين تسمع أي صوتين يمكن أن eB‏ من هذه الجوانب المختلفة» مثل 
شوكة رنانة وأرغن» فهما يصدران صوتين مختلفين نتيجة عامل أو أكثر». 
ويعبر شكل الموجة عن قيم شكل الموجة أو التردد الأسامي لهذا الصوت» فالصوت 
ينظر إليه عادةً على أنه عمليّة فيزيائية ESL‏ 0353 من جزأين أساسيين: 


* منتج حقيقي للصوت؛ ويمثله OWA‏ الصوتيان. 


-١‏ بمعنى أنه يمكن عن طريقها تمييز صاحب pall‏ مع تشابه الصوتين. 


-14- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ييا 


° مشكل للصوت؛ وهو عبارة عن منتج مساعد» يقتصر دوره على إتمام عملية 
التوجيه واكتساب الصفات التمبيزية» وتمثله باقى أعضاء النطق مثل: اللّسان 
والشفاه والأسنان... إلخ. 
وتحاول عملية تحليل التنغيم رصد هذا التردد الأساسي للصوت المنطوق. 
وهناك عدّة قواعد لمعرفة التردد الأساسي تخلص إلى أنه العنصر الأقوى الذي Wet‏ 
ندرك علاقة التلازم بين الصوت وصاحبه؛ فبمجره أن نسمع جملة نعرق قائلها بسبب 
معر فتنا لتنظيمه. #ويمكن أن نميز po‏ عن ضوت ST‏ بشكل الموجة التي is oF‏ 
منهماء وليس شكل الموجة مقياسًا بالمعنى الدقيق» ولكنه مجرد وسيلة لتمييز الأصوات 
بتحليلها إلى الموجات التي تتكون منها». 

وتظهر معام التردد الأسامي على هيئة منحنيات أفقية موازية لخط الزمن» وتكون 
أكثر وضوحًا مع الأصوات المجهورة؛ حيث Fee‏ الحبلان الصّوتيّانَء وتتواجد القيم 
DES‏ بين ۲٠٠-۸٠١‏ هرتز بالنسبة للمتحدثين الذكور» وتتزايد هذه القيمة مع 
الإناث لضيق الحنجرة عن حنجرة الذكور» وقلة سمك الأحبال الصوتية؛ فتبلغ قيمة 
هذه الحزم مع الأنثى البالغة * Yo V0‏ هرتز. ويوضح الشكل CÉ- Y)‏ منحنى التردد 
اللأساسى لكلمة مفردة. 


الشّكل ؟-:: منحنى التردد الأساسى لكلمة مفردة. 


في هذه الصورة تتواجد قيم التردد الأسامي بين ٠٠١‏ و ١5١‏ هرتز» والصورة عبارة 
عن رسم طيفي لكلمة «فوناتيك» بصوت ذكر بالغ» ونلاحظ أن التردد الأساسي في 
المقطع الأول أعلى منه في المقطعين الثاني والثالث» ويظهر الشكل Y)‏ 07( منحنى التردد 
الأساسي لجملة خبرية. 


-V +- 


fxanal (1.01) FX.01 


Y JN‏ 107 معد oa pl‏ اساي Dad‏ خرية: 
ويعرض الشكل صورة Lib‏ لجملة خبرية تمثل النغمة الحابطة؛ حيث يبدأ فيها 
التردد الأساسي منخفضًا ثم يزداد في منتصف الجملة ليصل إلى أقل انخفاض في ble‏ 
الجملة» والجملة هي قوله HAM ri GRE EP: ds‏ :4 


الشّكل IH‏ منحنى التردد الأساسي Dad‏ استفهامية. 


JINI‏ الشكل (1-Y)‏ صورة طيفية ilat‏ استفهامية تمثل النغمة الصاعدة» 
ere g ee e T t‏ 


dt as VERI الشكل السابق» والحملة هي قوله تعالى :قل‎ à الأساسي‎ s 
[VY pif 
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(Sound intensity) شدة الصوت‎ — 0, ١ 
هي قياس كمية الطاقة الصوتية لصوت ما بالنسبة إلى كمية طاقة صوتية ثابتة‎ 
ويتم القياس بطريقة لوغارتمية» وتسمى وحدة شدة الصوت‎ qu تستخدم‎ 

«الديسيبل» (decibel)‏ واختصارها -dB‏ ومن ol‏ أنواع الديسيبل: 

.(dB sound pressure leveldBspl) الصوت‎ bas ديسيبل‎ 

* المرجع الثابت هو طاقة صوتية قدرها ٠, ٠٠٠۲‏ داين/ Now‏ 

* وتحسب شدة الصوت ٠١ = GN‏ لو (الطاقة الصوتية المراد قياس شدتها + 

الطاقة الصوتية المرجع). 

فمثلا إذا كانت طاقة صوتية قدرها؟٠ ٠,‏ داين/ OB Tew‏ شدة الصوت بها 

۰× لو ette, Y)‏ )= ۲۰ لو Yx Yrs lee‏ ٠غ‏ ديسيبل. 

حيث: الداين: هو وحدة قياس الضغط LVN]‏ ومقداره ٠٠٠١/١‏ من الجرام» 
«وضغطة موجة ما هو عبارة عن عدد الداينات التي تضغط على مساحة سنتيمتر مربع 
.]١١[ Get,‏ 

والديسيبل هو وحدة شدة الصوت وهو وحدة ليس ها تمييز؛ LEY‏ نسبة بين كميتين 
من الطاقة» وهو الأساس لقياس كل الأصوات في الطبيعة AS]‏ ضوضاءء أصوات 
حيوانات وغيرها- ويتم قياسه عن طريق جهاز قياس شدة الصوت. 

ويمثل الديسبل «مقياسًا عمليًا لقوة الصوت وضغطه. والديسيبل che ٠١/١‏ 
والبيل هو ضغط أضعف صوت تدركه الأذن الإنسانية» .]١١[‏ 

وتقاس شدة الصوت «بأجزاء من عشرة آلاف مليون مليون من الوات في السنتيمتر 
المربع» وتبلغ قوة أضعف صوت تسمعه الأذن جزءا واحدا من عشرة آلاف مليون 
مليون وات سنتيمتر مربع» EVV]‏ 


-VY- 


١‏ و - الرّسم oe‏ (شكل الموجة) 

يعرف الصوت oh Ghji‏ سلسلة لتغييرات الصغط في الوسط بين المرسل 
والمستقبل. فالصوت Goals Sth bs ya‏ في ال مواء Sih GRE VI ER‏ 
للضغط aM a S‏ في اتجاه الخارج» ثم في FAB RS‏ إلى JI SRE‏ 
[Y Yo] (ate‏ فالمرسل عندما يبدأ عملية إصدار الصوت OB‏ الصوت الخارج 
منه يقوم بالضغط على الحواء في شكل موجات متلاحقة تصطام بالمستقبل l‏ ميكرفون 
أو أذن مثلا- فتحدث عملية التخلخل التي تصاحب الضغطء وأكثر الأمور شيوعًا 
لتمثيل معالم الصوت الحسية ورصدها هو الرّسم GAS‏ الذي يطلق عليه الشكل 
الموجي. ويمثل المحور الأفقي فيه حور الزمن وتتم قراءته من اليسار إلى اليمين بينم 
يمثل المنحنى الرأسى قوة هذا الصوت في لحظة معينة» في الوقت الذي تظهر فيه عدد 
الترددات الذبذبية TAI‏ الواحدة على هيئة تتابع وتلاحق هذه الخطوط الرأسية لهذا 
ا 

فعندما ننطق أية كلمة (دفقة صوتية واحدة) في البداية سيتم التنفس من الرئتين 
ثم يخرج أهواء إلى الحنجرة الذي قد يسبب عند مروره بها اهتزاز الحبلين الصوتيين 
ويستمر في مسيره حتى يصل إلى القناة الصوتية وينتقل منها إلى التجويف الفموي'» 
وبعدها تخرج الكلمة وتصبح مسموعة وتتحول إلى شكل الموجة. ويظهر الشكل -Y)‏ 
(V‏ صورة للرسم التذبذبي من خلال برنامج -Cool Edit Pro‏ 


التردد 
الوقت 
الشكل ۷-۲: صورة للرسم التذبذبي (شكل Gn ll‏ كما يعرضه برنامج Cool Edit Pro‏ 


من الشكل Y)‏ 7( يمكن تحليل صوت الفاء بأنه صوت استغرق die ١١5‏ 
MASE‏ وهو صوت dle‏ التردد ٠٠٠١‏ هرتزء ضعيف الإساع. بينا تمثل النون قوة 


(nasal cavity) للمرور بالتجويف الأنفي‎ el gbl وفي الأصوات الأنفية يضطر‎ -١ 
للمرور‎ el gbl من الثانية وفي الأصوات الأنفية يضطر‎ ٠٠٠١ /١ ويعنى ميللى ثانية‎ ء٠٠٠١‎ /١ تعنى‎ Milli كلمة ميل‎ - ١ 
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60 ذبذبة» وقد استغرق هذا الصوت‎ ٠ هرتز» مع ترددات متوسطة‎ 0 0 ee 
ميللي ثانية.‎ 

١7١ وقد استغرق‎ ole صوت الدال فهو منخفض الترددات» ومنخفض‎ Ul 
ميللي ثانية. وبالنظر إلى الشكل (۸-۲) نرى إحداثيات شكل الموجة من خلال المحورين‎ 


السيني والصادي. 
الشدة او الطاقة 
NEP‏ التمثيل الموجي 
الوقت 


الشّكل A-Y‏ وتظهر فيه إحداثيات شكل الموجة حيث المحور السيني هو الوقت 
والصادي يمثل الشدة. 


V, ١‏ - علم الأصوات وطرق التحليل الصوتي 

الفوناتيك هو جزء من علم اللغة» إنه معني بدراسة الحدث الناتج بواسطة الأعضاء 
الصّوتيّة البشريّة» ويعنى بالأخص بدراسة الحدث اللغوي الذي يُسْتَخْدَّم في الكلام 
البشري» ويعد التحليل الطيفي للأصوات من أهم جوانب البحث الصوتي» وهو 
الجانب الذي LE‏ إليه كثيرًا بالجانب الصوتي التجريبيء أو التحليل الميكني للصوتيّات 
البشرية. l‏ ْ 

ويتم التحليل الصوتي (Phonological analysis)‏ بواسطة أداة أو أكثر من الأدوات 
المتاحة هذا الغرضء ومن بينها أفلام أشعة إكس Cully (OX Ray)‏ جريان الهواء 
«(Pneumotachogrph)‏ والكيموجراف «Kymograph)‏ والإليكتروميوجراف 
«(Electromyograph)‏ والإسبيكتر وجراف (Spectrograph)‏ واللارينجوجراف 
«(Laryngograph)‏ ورسام الحنك الإلكتروني ..(Electro palato graph)‏ إلخ. 


.(nasal cavity) بالتجويف الأنفى‎ 


-5/ا- 


وهدف كل هذه الأجهزة والآدوات إظهار المعالم الحسية للصوت بشكل ماء 
بالإضافة إلى محاولة رصد بعض جوانب تلك الإشارات أو المعالم الحسية للصوت 
البشري على هيئة صورة يمكن طبعها على الورق أو رصدها على شاشة كمبيوتر. 

والكمبيوتر اليوم هو من أكثر الأدوات سهولة واستخدامًا؛ فعن طريقه تعد عمليّة 
التحليل الصوتي أبسط كثيرًا وأسرع Bale‏ إذا ما قورنت بالأدوات الأخرى» مع BUH‏ 
على جودة النتائج» وإمكانية جمع كل الأدوات في برنامج واحد. 

(Spectrogram) الصورة الطيفية‎ A, \ 

نستطيع تمثيل الصوت اللغوي عن طريق الصورة الطيفية وهي ذات BU‏ أبعاد: 
الوقت» والتردد» والشدة» ويمثل المحور EBY‏ في الصورة الطيفيّة منحنى الرّمن 
Ll C o coal JI opel i ena cast WLLL‏ لبعد LI‏ وهو مدي ال 
أو شدة الصوت alc‏ قرب أو بعد لون الصورة عن لون الخلفية. وقد تعتبر الصورة 
Canby‏ عددا من الشلاسل المتوالية إذا نظرنا إليها من أعلى (مسقط أفقى)؛ حيث JE‏ 
الزيادات أو القمم الرأسية في الصور الطيفية بالبقع المظلمة في adl‏ الطَيفيّةه Lets‏ 
تعبر عن شدة الصوت المنطوق. 

ويعد جهاز المطياف من أفضل الأجهزة التي خدمت الصوتيات الأكوستية إن لم يكن 
أفضلها على الإطلاق» حيث يقوم بعرض صورة مرئية للنطق تكشف عن خصائص 
الكلمة المنطوقة» وهو يفيد في معرفة صفات الأصوات اللغوية وترجيح أوجه الخلاف 
في وصف بعض الأصوات التي دار حوها الجدل Gad‏ وحديثاء «ونظرًا OY‏ موجات 
الصوت اللغوية من النوع المركب فإن عرضها باستخدام جهاز عارض الذبذبات لا 
يقدم كل التفاصيل عن الموجة الصوتية. بين يقدم المطياف ثلاثة أبعاد للموجة المرسومة 
وهى: التردد» والشدة» والزمن. وهذا يعين الباحث في معرفة زمن الصوت. والتردد 
acp uA‏ الرنيتي وشدته» ولذا فإن معطم دراسات co palla ST‏ اللغوية 
تعتمد على المطياف بشكل أو بآخرا [Y M‏ 

وبالنظر إلى الشكل (A7 Y)‏ نرى صورة طيفية مأخوذة من المطياف توضح الأبعاد 
الثلاثية للصوت المنطوق. 
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الوقت 


الشّكل ۹-۲: صورة طيفية مأخوذة من المطياف توضح الأبعاد الثلاثية للصوت المنطوق. 


من الصّورة يتضح لنا اختلاف طبيعة الأصوات المنطوقة حسب معطيات الصورة 
الطيفية» ففى الحرف الاحتكاكيٌ المهموس نجد أن الطّاقة مركزة بكثرة في نطاق التردد 
de dE Spies ql of‏ ذا else E d W ce E pil at)‏ 
المهموسة-الانفجارية على سبيل المثال-فإن هذه الأصوات تتكوّن من فترة صامتة حتى 
تظهر الطّاقة فجأة وبقوة في نطاقات o3 AI‏ أو الحزم» على هيئة انفجار. 

وتبدو الأصوات المجهورة أكثر تنظيًاء وتبدو أعلى السّلسلة (البقع المظلمة) في 
الواقع على هيئة خطوط في وضع ail‏ الشّكل عبر الصّورة الطيفيّة» وتمثل هذه الحزم 
الذبذبات؛ حيث يعطي شكل الفم رنين الصوت» هذه الحزم تُسَمّى المعالم» ويتم ترقيمها 
من الأسفل إلى الأعلى على هذا النحو فا ف۲ ف" أو FY ۴۲ EY‏ إلخ؛ وتختلف 
مواضع هذه الحزم باختلاف نوع الصوت المنطوقء ومن الممكن تحديدها بشكل تقريبي 
مع ed‏ 

فهذه الحزم الصوتية التي يطلق عليها المعالم هي «الترددات أو مجموعة الترددات 
التي تشكل نوع الصوت وتميزه عن الأصوات الأخرى ذات الأنواع المختلفة» * LY‏ 

ومن خلال الشكل )٠١-۲(‏ نرى صورة طيفية توضح أبعاد الحزم الصوتية 
للحركات القصيرة. 


-VT- 


Wit WM 


Xil‏ دد 


eer 


الشّكل ٠١-١‏ : صورة طيفية توضح أبعاد الحزم الصوتية للحركات القصيرة» مصدر الصورة: 
موسوعة ويكيبيديا. 

Y‏ ,4 الكتابة الصوتية 

تمثل الكتابة العادية طريقة واحدة للتعبير عن الأصوات عن طريق مجموعة من 
الرموز الكتابية. فإذا كانت اللغة عبارة عن «أصوات يعبر بها كل قوم عن أغراضهم) 
op‏ الكتابة هي رموز يعبر بها كل قوم عن صواتمم» وتقوم الكتابة على نظام رمزي 
صوتي» «ومهمة هذا النظام أن يزودنا بالرموز التي يمكن أن نعبر بها عن القيم الصوتية 
المختلفة للمواد اللغوية في لغة ما» [YY]‏ 

Bally والصوت» ييخ المجاء‎ BAI الفاق رين‎ GU ALLS BREL ERN 
سابير اللغة العربية من‎ de وقد‎ [YY] الذي توافق عليه علماء اللغة والأصوات»‎ 
نظام‎ à الوحيدة الحاملة للحضارة الإنسانية والتي يسهل إدراجها‎ oo اللغات‎ 
الكتابة الصوتية العالمية.‎ 


-NN- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):َُ6ا ب ييا 


ومنذ فترة ليست بالبعيدة استطاع علماء الأصوات أن يبتكروا ألفبائية جديدة للتعبير 
عن الأصوات المختلفة. وتحاول هذه الألفبائية BUH‏ على قرب العلاقة بين الرموز 
الكتابية والضّوت المنطوق. وتعتبر الألفبائية المستخدمة على نطاق واسع هي: IPA‏ 
أو (International Phonetic Association)‏ وهو اسم جمعيّة صوتيّة دوليّة نشأت 
أواخر القرن التاسع عشرء وكانت المراجعة الأخيرة لها في عام e AAA‏ ويعمل نظام 
IPA‏ على إيجاد رمز لكل فونيم في كل لغة بشريّة» ووضع علامات تشكيلية NFU‏ 
التى تعتري أية لغة من اللغات. 

وقد قسمت هذه الجمعية اللغوية الأصوات الإنسانية إلى ستة أقسام» هي : 
* رموز لأصوات صامتة رئوية. 
رموز لأصوات صامتة غير رئوية. 
* رموز لأصوات ale‏ (الحركات). 
رموز لأصوات نغمية. 

° رموزلعلامات تييزية. 

* رموز الفوقطعيات. 

ثم تطورت فكرة هذه الألفبائية» واكتست ثوبًا جديدًا يتوافق مع سهولة التعامل مع 
الحاسب الآلي؛ بحيث يجد كل رمز صوتي مكانًا له على لوحة المفاتيح GULL‏ وقد تم 

(SAMPA - Speech Assessment Methods Phonetic Alphabet) 


فجمعت الرموز الصوتية العربية على النحو المبين في الجدول :)١-7(‏ 


-VA- 


| الرمز | الكلمة المثال | الكتابة الصوتية | | الرمز | الكلمةالمثال | الصوتية‎ | 
الصوامت الاحتكاكية: الحركات:‎ 
Dil ظل‎ I fi: فيل‎ F 
X\al حل‎ A nivi:n نفين‎ V 
umr’? عمر‎ U Tala:T ثلاث‎ T 
rd? عيد‎ i: Dakar ذكز‎ D 
ma: مال‎ a: D'ala:m e» D' 
fu:l فول‎ u: sa? ‘i:d سعيد‎ S 
كات‎ H أنصاف‎ zami:l dej Z 
wa:hid واحد‎ W s'aGir pw s` 
Jawm يوم‎ J Sams شمس‎ 5 
Zami:l de Z 
الصوامت:‎ xit'a:b -—— X 
الصوامت الانفحارية:‎ Garb غرب‎ 6 
ba:b باب‎ 8 X\ilm حلم‎ X\ 
tis?" تسع‎ 1 ?"alam علم‎ T )0( 
da:r دار‎ D hawa:? el ga H 
t'a:bi? طابع‎ t الصوامت الأنفية‎ 
d'arab c d ma:l مال‎ M 
kabi:r كبير‎ K nu:r نور‎ N 
gami:l d G الصوت التكراري:‎ 
He rima:l رمال‎ R 
akl? الصوتان الجانبيان: 9 أكل‎ 
Qalb قلب‎ 0 la: لا‎ L 
Paris ترس‎ P ?al''ah الله‎ I 


الجدول ١-7‏ : الأصوات العربية. 


-V4- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


- آليات التنفيذ. وإعداد قاعدة البيانات الصوتية 
يمكن تفصيل نقاط البحث في هذا المبحث إلى: 

۲ - أجهزة التحليل Spall‏ 

Y LY‏ الأدوات والبرامج التحليلية الحاسوبية 


V, Y‏ — أجهزة التحليل الصوتي 

اعتمدت الدراسات الصوتية ة في التراث العربي على قدر كبير من الملاحظة المباشرة 
امو نا ane‏ ار ak qc‏ 
التجريبي في شتى oVle‏ البحث العلمي حدث تطور كبير في آليات معالحة هذه 
الدراسة «واستخدم علم الأصوات مكل القرن التاسع pe‏ الأجهزة الدقيقة سواء 
الفسيولوجيا والفيزياء وال هندسة الكهربائية ومعالجة الكلام وطب الأسنان وغيرها» 
[. فقد أصبحت pall‏ تبات علا معمليًا (يعتمد على التجارب التى Ley gs‏ تعتمد 
على معامل مجهزة Éo ued‏ يواكب التطور العلمي والتقنى الذي نعيشه» وهناك 
أجهزة تخدم فروع الصوتيات الثلاثة: النطقية والأكوستية والسمعية» فيمكن متابعة 
وضع تجارب واستخدام أجهزة دقيقة؛ لمعرفة الكيفية التي تتم بها عمليتي السمع 
A‏ هذا لكر من اليد ee ee RO‏ 
الصوتيات phonetics‏ دقيقة لدرجة كبيرة g‏ 5 تتمتع بالثبات IY M Ge Lo Als‏ 

وسوف يعرض الباحث فيا يلي لأهم الأجهزة | لمستخدمة في الت لتحليا الصوي: 


* جهاز الرسم الحنجري (Laryngograph)‏ 

«وهو جهاز إلكتروني يمكننا من استنتاج حالتي الفتح والغلق للأوتار الصوتية عن 
طريق تسجيل اتجاه التيار من أحد جانبي الحنجرة إلى الجانب o8 I‏ ويمكن تحويل 
هذا التسجيل إلى صوت يمثل نتيجة عمل الأوتار الصوتية دون تأثير أي رنين صادر 
عن القناة العلياء كا لو كنا قد فصلنا تجاويف ما فوق الحنجرة» وسمعنا ذبذبة الأوتار 
الصوتية بدونها») ] * LY‏ 


A4 


" مقياس التنفس (Spirometer/Respirometer)‏ 

يفيد هذا الجهاز في قياس مقدار وقوة واتجاه هواء الزفير» والجهاز عبارة عن خرطوم 
مطاطي متصل بجهاز قياس» حيث يوضع الأنبوب المطاطي في فم المتحدث مع إغلاق 
فتحتي الخيشوم» فيقوم الجهاز برصد مقدار وقوة واتجاه التنفس. 

(Pneumotachogrrph) «| gb) انسياب‎ lis " 

فائدة هذا الجهاز قياس مدة انسياب هواء الزفير الخارج من الأنف والفم معًا أو كل 
على da‏ والجهاز عبارة عن كيامة توضع حول الفم والأنف مع وجود عازل deer‏ 
وتتصل هذه الكامة بجهاز قياس فترة خروج اهواء. 

ويفيد الجهاز في «معرفة حجم المواء الخارج من الجهاز الصوتي مع كل «m Ro‏ 
وعلاقة حجم el pl‏ مع الأوضاع المختلفة للجهاز الصوتي. فمن المعلوم أن حجم el gdl‏ 
الخارج من الجهاز آثناء نطق / ز/ أقل من ذلك المصاحب للصوت | س/ » حيث إن 
الرقيقتين الصوتيتين تعيقان انسياب المواء في الأول فيقل حجم المواء الخارج» وذلك 
بعكس ما يحدث أثناء نطق / س/ » ويمكن بواسطة هذا الجهاز معرفة ما إذا كان 
الصوت Cal‏ أم فمويًا أم أنفمويّك وذلك بتتبع حجم المواء الخارج من الفم والأنف 
أثناء نطق الصوت موضع الدراسة» LYN]‏ 


" منظار الحنحرة أو المجهر الحنجري (Laryngoscope)‏ 

يقوم هذا الجهاز برصد حركة الأوتار الصوتية» وهذاالمنظار عبارة عن مرآة مستديرة 
قطرها بوصة» ويوضع هذا المنظار في فم المتحدث فيعكس صورة الأوتار AS pall‏ 
ويبين إذا كان الصوت المنطوق مهموسًا أو مجهورًا. «ويعيب هذه الآلة أنها تتدخل في 
سير الكلام الطبيعي» وأنها لا يمكن استعالها إلا في حالات محدودة» 1* LY‏ 

" مجهار العضلات (Electromyograph)‏ 

يفيد هذا الجهاز في رسم إشارات تعبر عن حركة العضلات المصاحبة لعملية النطق؛ 
حيث يقوم بقياس الشحنات الكهربائية الصادرة من المخ التي تؤدي إلى تناغم ما يزيد 
عن مئة عضلة في الجهاز الصوتي؛ لتوليد الصوت الإنساني بشكل سلس. 


—AY- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


(X Ray) الأشعة السينية‎ " 

تقوم هذه الأشعة بتصوير أعضاء الجهاز الصوتي أثناء قيامه بعملية إنتاج الكلام» 
فهذه الأشعة «تسمح بدراسة كل موقع CY‏ عضو من أعضاء الكلام عند أي نقطة أثناء 
الكلام» وهناك كذلك الصور المتحركة لأشعة إكس التي تسجل حركات هذه الأعضاء 
أثناء النطق» ومن الممكن مصاحبة هذه الأفلام بتسجيل صوتي حتى يمكن أن تستمع 
إلى الصوت وتشاهد الحركات التي تقوم بها أعضاء النطق أثناء إحداث هذه الأصوات» 
[Y*]‏ وقد اتجه العلماء حديثًا إلى استخدام الأشعة السينية المنخفضة لتفادي الأضرار 
الناتجة عن تعرض الجهاز الصوتي للأشعة السينية لفترة AL gh‏ 

(Electropalatograph) سام الحنك الإلكتروني‎ jT 

يستخدم هذا الجهاز في رسم الحنك حال نطق الأصوات بطريقة إلكترونية» والحنك 
هو التركيب الفاصل بين جوف BY‏ وجوف الفم» فهو سقف الفم وأرضية BW‏ 
ويمتد الحنك نحو الخلف ليفصل Ge‏ بين التجويف الأنفي والتجويف الفموي» 
للحنك شكل القبة ويتألف من قسمين هما الحنك الصلب الذي يشكل الجزء الأمامي 
والحنك الرخو الذي يشكل الجزء الخلفى care‏ ويمثل الحنك الصلب الجزء العظمى من 
الك ويشكل caza Seale cdi,‏ راف هن Dll pala) cel ysl‏ 
العلويين في الأمام ومن الصفيحتين الأفقيتين للعظمين الحنكيين في الخلف. ويفصل 
الحنك الصلب جوف الفم عن جوف BW‏ 

أما الحنك الرخو أو الحنك اللين فهو الجزء الخلفي من الحنك «وهو عبارة عن 
طية ليفية عضلية متحركة ومعلقة BULL‏ الخلفية للحنك الصلب» هذه الحافة الخلفية 
للحنك الرخو حرة وها في المستوى الناصف استطالة تدعى -GUI‏ 

ويقوم جهاز رسام الحنك الإلكتروني برسم «أجزاء الحنك التي يلامسها اللسان 
أثناء الكلام كل ٠٠١/١‏ من الثانية = ٠١‏ ميللي ثانية. يتكون الجهاز من حنك 
صناعي مصنوع من البلاستيك ويحتوي على AME‏ حالبًا- يزيد عددها أو ينقص حسب 
نوع الجهازء يتم تثبيت الحنك الصناعي في الفم ملاصقا للحنك الطبيعي وموصلا 
بحاسوب. أثناء التجربة» يعرض الحهاز الحوالب التى يلامسها اللسان أثناء التتحدث 
إما على الشاشة أو بالطابعة على الورق» l [Y V1‏ 


—AY- 


"ان سام الحنجرة الإلكتروني (Electrolaryngograph)‏ 
«يتكون الجهاز من حالبين يوضعان على سطح UH‏ المغطي لغضروف الحنجرة 
بحيث يقعان على الصفيحتين الخضروفيتين» يتابع الحالبان حركة تقارب الرقيقتين 
الصوتيتين أثناء إصدار em eal‏ وتنقل الإشارة إلى جهاز عرض أو رسم» والجهاز 
يقيس تردد الرقيقتين الصوتيتين ونمط التردد» وله فوائد في تحديد ما إذا كان عمل 
الرقيقتين الصوتيتين طبيعي أم لا» EY‏ 
Y‏ , 7- الأدوات والبرامج التحليلية الحاسوبية 
للقيام بعمل قاعدة البيانات يتعين على الباحث الاستعانة ببعض الأجهزة والبرامج 
الأساسية والأدوات المساعدة للخروج بأفضل عمل osa‏ وهي كالتالي: 
COOL EDIT PRO‏ 
SFS (Speech Filing System)‏ 
EMU SPEECH TOOLS‏ 


HTK (Hidden Markov Model Tool Kit) 

وفي| يلي إشارة وجيزة عن هذه الآليات وطريقة إفادته منها. 

(COOL EDIT PRO) برنامج‎ * 

هذا البرنامج من أهم البرامج المستخدمة في إنشاء قواعد البيانات الصوتية؛ 
وذلك لقدرته على إظهار الصوت على هيئة مرئية» USE‏ من ملاحظة الصوت بدقة. 
وإجراء التعديلات المناسبة عليه من حذف Ts J5l » JI‏ تشوب الصوت ولصقها 
وتقطيعها وإزالتهاء وبه يتم تجهيز الصوت تجهيرًا EE‏ حتى يصبح جاهرًا لأغراض 
المضغوط. ويفيد هذا البرنامج في عرض الصورة الطيفية للصوت المسجل» کا يعرض 
لمستوى ذبذبات كل صوت وشدته ودرجة ogle‏ أو انخفاضه. بالإضافة إلى إمكانية 
إدراج خلفيات للصوت وقياس صداه. ويعرض الشكل ONY)‏ صورة توضيحية 
للبرنامج. 


—AY- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
!زر ee‏ 


eI ع سه‎ soi Cael tala fva PU 7| 

[cs 29 fe pe et o» v 

CaSO? PROS SNe Aare MIO ASN Der 
a v^ سسسب‎ 


AA Db. ay ARE S oA as. 


.COOL EDIT PRO صورة توضيحية لبرنامج‎ :١١-۲ الشّكل‎ 
http://www.softpedia.com/get/Multimedia/A udio/Au-dio-Editors-Recorders/Cool- 
Edit-Pro.shtml 


(SFS -Speech Filing System) نامج‎ p" 
برنامج مستخدم حديثا في مجال تجهيز قواعد البيانات؛ حيث تم الاعتاد عليه‎ 
وذلك في خطة تطوير الأدوات المستخدمة في بناء قواعد البيانات الصوتية»‎ ls pe 
المقاطع‎ bly تحديد بدايات‎ Jle وبالنسبة لهذا البرنامج فقد أظهر كفاءة ملحوظة في‎ 
الصوتية تحديدًا دقيمًاء كا يتيح لنا هذا البرنامج مجالا خصبا للتعرف على صور مختلفة‎ 
والقوة» ومن حيث الأداء الصوتي‎ BUI من حيث‎ Spall من مستويات‎ 
صورة توضيحية‎ (VY-Y) والحنجري والنبري للكلات المختلفة. ويعرض الشكل‎ 

„SFS لبرنامج‎ 


AE 


apa.wav - SFS/WASP 


Ele Edit Signal View Help 


S| el > lal [vim Sf^ »| =| + |+| |‏ هوام 


الشّكل VY-Y‏ صورة توضيحية لبرنامج SES‏ 
www.phon.ucl.ac.uk/resource/sfs‏ 


(EMU SPEECH TOOLS) نامج‎ p" 
سماع الفونيمات كل على‎ W برنامج ترجع أهميته الشديدة هنا إلى أنه يتيح‎ 
(spectrogram) حدة مع ظهور الكتابة الصوتية لكل ملف من الملفات» ويظهر‎ 
وهما مساران مهمان في تحديد مواضع الفونييات وتحريكها‎ (samples) وكذلك أيضًا‎ 
إلى أنسب المواضع» حيث تبداً الفونيمات من أماكنها الصحيحة» كا أن أي إجراء يتم‎ 
المهمة» کا يمكننا البرنامج من تغيير أو‎ lab على هذا البرنامج يكون تعديلا في ملفات‎ 

إزالة أية فونيهات أو إضافتها حتى تكون الكتابة الصوتية مطابقة تماما للصوت. 


ويوضح الشكل (NYY)‏ صورة توضيحية لبرنامج EMU‏ 


—A0- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
+ ب لل ل لغ ييا 
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الشّكل ؟-1: صورة توضيحية لبرنامج .EMU‏ 


www.emu.sour ceforge .net 


(Hidden Markov Model Tool Kit- HTK) نامج‎ p" 
EA اكوك‎ d ene 
TNI DON الي‎ 
تنتج عن هذه الخطوة التي تحتاج إليها في إجراء التعديلات على‎ lab أن ملفات‎ (S 
مواضع بدايات الفونيهات» كما تعد تلك الملفات جزءًا رئيسيا في قاعدة البيانات التى‎ 

يتم تخليق الصوت منها LY OT‏ 


AMT 


ببليوجرافيا مرجعيّة 


ابن جني» أبو الفتح عثمان :)۱۹۸١(‏ سر صناعة الإعراب» تحقيق حسن هنداوي» 
دار القلم» دمشق» .١ b‏ 

ابن سيناء علي الحسين: الرّئيس: تحقيق محمد حسان الطيان ويحيى مير (le‏ 
مطبوعات مجمع GU‏ العربيّة بدمشق. 

coal‏ أحمد أحمد راغب cQ 8) ael‏ فونولوجيا القرآن - «دراسة لأحكام 
التجويد في ضوء علم الأصوات الحديث» (رسالة ماجستير)» كلية الآداب» 
ael el‏ أحمد راغب أحمد(۳٠١۲):‏ دور المؤثرات الصوتية في تقدير المدى 
الزمني للفونيم» مجلة الدراسات اللغوية والأدبية» العدد OY‏ المجلد . 

e leue‏ أحمد راغب أحمد(5 :)3١ ١‏ تأصيل النظرية الصوتية عند إخوان الصفاء 
ale‏ الدراسات اللغوية والأدبيةء العدد ٦‏ المجلد الثاني. 

al‏ أحمد ael‏ راغب Y Yo) ael‏ قضايا صوتية خلافية في ضوء التحليل 
الصوت الحاسوبي. مجلة جامعة القدس المفتوحة, العدد ٠١‏ المجلد الأول.. 
أحمد. ael ael‏ راغب أحمد IQ Y)‏ الدرس الصوتي العربي بين النظرية 
والتطبيق» دار تمان YL «ool‏ 

ael ael al‏ راغب أحمد CVT)‏ النون والميم في القرآن الكريم دراسة 
صوتية حاسوبية» دار تمان Vb le)‏ 


الأصفهاني» cola 25 EIS‏ القرآن» تحقيق محمد سيّد كيلاني؛ دار المعرفة. 


. أنيس» إبراهيم :)۱۹۷١(‏ الأصوات اللغوية» مكتبة الأنجلو» ط 0 
. أيوب» عبد الرحمن EO MAE)‏ الكلام إنتاجه وتحليله» مطبوعات جامعة الكويت. 


. بولجرام» أرنست NAVY)‏ في علم الأصوات الفيزيقي» ترجمة د. سعد 


—AN-— 


cal 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


الحمدء غانم قدوري IO ST)‏ أبحاث في علم التجويد» دار عمار للنشر 
والتوزيع» الأردن. 

الحمد (O SAT‏ غانم قدوري: الدراسات الصوتية عند علماء التجويد» مطبعة 
الخلود ببغداد. 

الخولي» محمد على (۱۹۸۷): الأصوات d AUI‏ مكتبة الخريجي. ط .١‏ 

شاهين» عبد الصبور CY AVY)‏ المنهج الصوتي للبنية العربية» القاهرة. 

الصغير» محمد حسين علي :)۱۹۹٤(‏ الصوت اللغوي في القرآن الكريم» دار 
ضوة» إبراهيم :)۲٠٠١(‏ محاضرات في اللغة العربية والحاسبء دار الثقافة 
Vb cay yal‏ 


العاني» سلمان حسن O AY)‏ فونولوجيا العربية» ترجمة ياسر الملاح» مطبوعات 
النادي الأدبي الثقافي بجدة» ط١‏ . 


. عمرء أحمد مختار (Y e e e)‏ دراسة الصوت اللغوي» عالم الكتب. 


1 الغامدي» منصور بن محمد :)3٠١١(‏ الصوتيات العربية» مكتبة التوبة» ط .١‏ 


فتيح» محمد :)۱۹۸٤(‏ الأصوات العامة والأصوات العربية» دار الثقافة العربية» 
القاهرة. 

قدور» أحمد محمد (۱۹۹۸): أصالة علم الأصوات عند الخليل من خلال مقدمة 
كتاب العين» دار الفكر المعاصر» بيروت» Me‏ 

مصلوح» سعد IO IA)‏ دراسة السمع والكلام, القاهرة. 

الموسوي» مناف (IIA)‏ علم الأصوات اللغوية» عالم الكتب» بيروت» AB‏ 
هلال» عبد الغفار حامد (۱۹۸۸): أصوات اللغة العربية» مكتبة الأنجلو 
Vb i pall‏ 
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هذه الطبعة إهداء من SAM‏ 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


- 06. 


الفصل ea‏ 
التحليل ot)‏ 2 الآليّ للمُفرّدات العربيّة 


-١‏ الكلمة كوحدة أساسية في معالجة النص العربي. 
-yY‏ أصناف الكلمات في النص العربي. 

-Y‏ طبيعة البناء الصرفي للمفردات العربية. 

٤‏ - الصيغة البنائية العامة للكلمة العربية. 

-٥‏ حجم حصيلة المفردات العربية. 

-٦‏ تعريف التحليل الصرفي SV!‏ وتطبيقاته. 

۷- التركيب الصرفي معبرًا الحوسبة التحليل الصرفي. 
8- الالتباس الصرفي وأساليب إزالته. 

9- بناء الموارد اللغوية اللازمة لفك الالتباس الصرفي. 


22 أدوات وبرمجيات ومعايير. 


=. uc 


هذه الطبعة إهداء من المركز 1 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


"im 


gyl الكلمة كوحدة أساسية فى معالحة النص‎ - Y 
تحفل لغتنا الجميلة بالعديد من الاستخدامات المجازية لمفردة «كَلِمة) التى من أمثلة‎ 
iude دلالاتها ما‎ 
| أَحَدَهُم‎ ste 13) LEP مقالة؛ مثل قوله تعالى‎ ح١‎ 
d Wu cM X فیا ركت‎ Ble أَعْمَلُ‎ LS 
[y 
كلم سيقت من‎ N hg. do Li Ja tail ری‎ gl DLL عفر ارهق‎ Y; 
[38 بينهم ... © [يونس‎ Gad ربك‎ 
رسول الله‎ R37 المسيح عيسى ابن‎ OE ...# آية ومعجزة؛ مثل قوله تعالى‎ CY, Y 
.]1١/١ [النساء‎ 4 ... Bs وروح‎ ei وكلمتة ألقاها إلى‎ 
إلى آخر ما هنالك من معانٍ ودلالات عديدة.‎ ... 
SY ولكننا هنا في إطار العلوم اللسانية ومعالجة اللغة نختار”" التعريف التقني‎ 
المحدد لتلك المفردة (الكلمة هى أصغر وحدة كلامية طليقة يمكن عند كتابتها أو‎ 
gs Ge queni ee ead qud 
مفرّد) وهذا بالطبع‎ Ad اللغويين العرب مثل «ابن هشام» هذا المفهوم بقوهم (الكلمة‎ 
فيه أن يحمل معنى أو دلالة‎ BAL عندما نضع في اعتبارنا أن «القول» لديهم اصطلاحًا‎ 
يتلقاها السامع أو القارئ.‎ 
على المستوى الصرفي أو النحوي أو‎ G pulo وبالنسبة للمشتغلين بمعالحة اللغة‎ 
الدلالي أو ما بعد ذلك من مستويات وتطبيقات لتلك المعالجات» فإن الكلمة لدم‎ 
كذلك هي وحدة أساسية للتعامل مع النص. ولأن كل تلك المعالجات على المستوى‎ 
BEY الحاسوبي مثقلة بمشكلة الالتباس (أي احتمال أكثر من تأويل) فإن الحاسوبيين‎ 
من نقطة بداية غير ملتبسة يستطيعون الانطلاق منها في عملهم» ويمكننا أن نطلق على‎ 
نتفهم‎ Ss (crude digital word) نقطة البداية هذه اسم «الكلمة الرقمية الخام»‎ 


الجدل Slate US‏ ولذا فقد أوردنا فقط أحد التعريفات العملية المقبولة على نطاق واسع. 


5 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ييا 


ماهية ذلك نحتاج أولاً لإلقاء نظرة على الهيئة الرقمية التي يبدو عليها النص الخام المراد 
تحليله Éa‏ 

يبدو JES)‏ النص» (text stream)‏ الرقمي الخام عند تداوله على الحاسبات الرقمية 
عبارة عن سلسلة من الشفرات «الأكواد» (codes)‏ يدل كل منها على رمز as‏ واحد 
إلى آخر ما هنالك من رموز. ويستخلص ال حاسوبيون الكلمات العربية الرقمية الخام من 
سيال النص الرقمي الخام بالتعريف الإجرائي غير الملتبس التالي: 

الكلمة العربية الرقمية الخام هي تسلسل من الشفرات يرمز كل منها إما إلى حرف 
التسلسل من كلا طرفيه شفرة لا ترمز إلى حرف هجائي عربي ولا إلى علامة ضبط 
صوق عربي. 

[Es‏ هذه الفقرة القصيرة (الواردة في هذا الشكل رقم ١‏ في الفصل رقم (Y‏ للتعريف 
الإجرائي لما اصطلحنا على تسميته «الكلمة الرقمية العربية الخام»» حيث AS oe‏ 


1 [|] - 


الشّكل 1-7 : استخلاص الكلمات العربية الرقمية الخام من النص العربي الرقمي الخام. 

والشكل رقم CY 7 Y)‏ أعلاه يعرض مثالاً على استخلاص الكلمات العربية الرقمية 
الخام من النص العربي الرقمي الخام. 

تصير هذه الكلمات العربية الرقمية الخام بعد استخلاصها جاهزة لمختلّف أنواع 
ALLA‏ الحاسوبية» والتى غالبًا ما يكون أوها التحليل الصرفي الآلي وهو بدوره يكشف 
ما إذا كانت هذه الكليات الرقمية الخام لا تؤدي إلى كلماتٍ غير عربية؛ سواء أكانت 
olds‏ أجنبية مكتوبة باالحروف el (Transliterated words) ay SI‏ كانت مجرد كلمات 
خاطئة غير ذات معنى» أو كانت تؤدي إلى كلمات 6 dy‏ سليمة بأصنافها المختلفة وهو 
ما يشلمنا إلى القسم التالي الذي يعرض لتصنيف الكلمات العربية. 


^E 


-Y‏ أصناف الكلمات في النص العربي 

عند عرض الكلمة العربية الرقمية الخام على ME‏ صر BE WT‏ فإنه من 
المفترض أن يستطيع هذا المحلل التعرف على تصنيف الكلمة (أو الكلمات) العربية 
الحقيقية التي تناظرها هذه الكلمة الرقمية الخام. 

فمن الوارد ألا يتوصل المحلل الصرفي إلى أية كلمة عربية حقيقية تناظر الكلمة العربية 
الرقمية الخام التي قد تحتمل Bare‏ أحد أمرين؛ إما lel‏ كلمة غير عربية (أجنبية) مكتوبة 
بحروف عربية (Transliterated)‏ كالأمثلة التي ترد في الحالة JRL ١و Y‏ رقم Y)‏ - 
G(T‏ ختام هذا häll‏ ؛ أو Ul‏ كلمة خاطئة كالأمثلة التي ترد ني Y JU‏ نفس 
الشكل. oos‏ يكون الخطأ في الحالة رقم Y‏ طا Css Us‏ فزن الكلية اة 
الخام عبارة عن سلسلة > Gy‏ عشوائية لا معنى cb‏ أو أن منشأ h‏ خلط من الكاتب 
(أو من الناسخ) بين حروف الهجاء أو إسقاط بعضها أو التصاق كلمتين ... إلخ. 


Y‏ - تمييز الكلمات الأجنبية المكتوبة بحروف عربية 
وقبل استكمال استعراض ال حالات الأخرى التي يجملها الشكل رقم o =F)‏ 
موضوع التمييز بين WS‏ الحالتين السالف ذكرهما يستحق وقفة متأنية لأنه ليس بالأمر 
التافه وإن بدا كذلك لأول وهلة. فالبعض بالفعل يقارب هذه المسألة عبر إنشاء قوائم 
مطوّلة بالكلمات الأجنبية التي SS‏ بحروف عربية» وعلى الرغم من البساطة الظاهرية 
هذه المقاربة إلا Leal‏ ملغمة بالمشكلات الخمس الآتية: 
* يتغير تواتر الكلمات الأجنبية التي تكتب بحروف عربية - وهي في الغالب 
ee MI‏ أساء — Gol puca ol pet‏ ما يردن هذه eM‏ في العليوم 
المعاصرة المختلفة أو في الأخبار - على وجه الخصوص - فإننا نجد باستمرار 
كلمات dd‏ وأخرى تختفي وبمعدل Jle‏ يزيد من تسارعه Le‏ الانفتاح اهائل 
في الاتصالات والعولمة» وهذا كله يجعل من تحديث مثل تلك الجداول - ناهيك 
عن إنشائها في الأصل - أمرًا عالي التكلفة. 
* منشأ هذه الكلمات الأجنبية التي قد نصادفها مكتوبة بالحروف العربية ضمن 
نص Ge‏ قد يكون- حسب تعريفها - هو أية لغة من لغات البشر خلاف 
العربية بالطبع؛ وعلى سبيل المثال: 


—{o- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


«ib» sY BID «إِذْوَارْدُو)ء»‎ ien eoo VER 
E «بودابشت»»‎ LG gea e e 5 92) لاسا وس ا‎ 
إلخ.‎ FT 64S dessus افر‎ TIUS m 
JA وهو ما يجعل أية محاولة لوضع ناذج -ولو تقريبية- تترصد أو تتحسب‎ 
Maza ذلك- أمرًا‎ og ger be أو ضرفا -أو‎ o CLASH هذه‎ 
يزيد من صعوبة الحصر أن الهجاء الذي تكتب به كل كلمة من هذا النوع يفتقد‎ 
بالطبع إلى مرجعية عربية وبالتالي إلى أية مرجعية» وعلى ذلك فهو أمر اجتهادي‎ 
قد يتغير من مترجم لآخر ومن كاتب لآخر؛ ومن أمثلة ذلك الهجاءات المتداولة‎ 
ASV للكلات‎ 
( e Gaee y « T « m 5g) ‘Birmingham 
MASS gd Ly Feed UE A Ly rad GR gh Jy ze :Sigrid Hunke 
إلخ‎ .... ARAL ap 

9 g HE. V : 3o 
(0 gus) «دایتون)» «داتون»)»‎ :Dayton 
إلخ‎ is Gp Gly gip :(England Englitera) 
حصر هذه الكلمات في جداول بسبب‎ she كما يرتفع التحدي أكثر وأكثر أمام‎ 
دخول اللواصق العربية على الكلمات الأجنبية المكتوبة بالحروف العربية» بل‎ 
ويمكن لهذا الدخول أن يغير من هجاء هذه الكلمات؛ ومن أمثلة ذلك:‎ 
e Gat SU» c gro SVi0 (أكَادِيمْيَا): «أَكَادِيوِيٌّ1.‎ 
e «Ce alo eO gees gall (فَرَنْسَا):‎ 
إلخ‎ ... CIS 5f» eS (أَرْمِيئيا):‎ 
أن كثيرًا من الكلمات الأجنبية التي تكتب بحروف عربية قد‎ aL ويزيد الطين‎ 
«ميت)» «تيم)»‎ nad) تشترك هجاتا مع كلمات عربية؛ مثل الأسماء الأجنبية‎ 


E us 


«دون)» ...) ومشتركاتها اللهجائية العربية («مير)ء «ميت)» (تيم)» لدون) ... 
إلخ). 
وسيب هذه الشكلات eras ss Ade Ob dace‏ لمعاطة Ay pall AAU‏ 
حاسوبيًا مقاربات أخرى أكثر احترافًا في هذا الصدد يمكن تصنيفها تحت القسمين 
التاليين: 
القسم الأول o‏ التعامل مع هذه المسألة بعد التحليل الصرفي إلى حين إجراء 
تحليلات لغوية من طبقات del‏ وذلك مثل «تعيين أقسام Part-of-)) ASII‏ 
Speech Tagging‏ و/ أو SYA‏ و/أو النحوء حيث تغتير dee‏ المسألة PERS‏ 
مسألة تمييز (أسماء (Proper Names) teste I‏ عن سواها من كلمات النص والتي 
توظف اللا Bole‏ أساليب تعتمد على بعض القرائن المرجّحة من مخرجات تلك الطبقات 
اللغوية اللاحقة إلى جانب النماذج الإحصائية الرياضية. 


القسم الثاني مرج هذه المسألة من إطار طبقة التحليل الصرفي» ويصدّرها ببساطة 
إلى مستوى التطبيق القائم على هذه المعالجة اللغوية. والمنطق وراء ذلك هو أن الاحتمال 
كبير أن يكون الحل ضمن التطبيق أكثر 1725 وأقل LOLS‏ وذلك با يتوافر عندئذٍ من 
معلومات إضافية - أو حتى قيود إضافية - كما أن التطبيق oo‏ يتطلب مجرد تمييز CB‏ 
فقط أو حتى لا يتطلب من الأصل Ld‏ الكلمات الأجنبية المكتوبة بحروف عربية. 
وعلى سبيل المثال؛ فإن تطبيقات الربط المعجمي مثلاً قد لا تهتم كثيرًا بهذا التمييز» في 
حين أن تطبيقات البحث النصي أو استرجاع المعلومات قد يكون الوعاء النصي الذي 
تبحث فيه Vans‏ لاحتمالات تأويل الكلمات سواء العربية el‏ الأجنبية والتمييز lee‏ 
فضلاً عن أن هذا النوع من التطبيقات G pas‏ غير مرهف الحساسية للأخطاء في هذا 
الصدد» أما تطبيقات التشكيل الصوت Go DY‏ الرئيسى هو دقة استنباط الضبط 
الصوتي لكل الكلمات المكتوبة بالنص العربي سواء أكانت عربية أم أجنبية ولذلك فقد 
يكون من الأفضل أن تحتفظ بكل التأويلات الممكنة وني Ole‏ المطاف تفاضل بينها 
Oel‏ وفق نماذج إحصائية los‏ مع قيود فونولوجية تضمن موافقة الضبط الصوتي 
e‏ للقوانين الصوتية العربية O‏ 


-١‏ القسم السادس من هذا الفصل مخصص لتطبيقات التحليل الصرفي الآلي للنص العربي. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


Y, Y‏ - تصنيف الكلمات العربية 

وبالعودة OVI‏ إلى استعراض بقية الحالات التي يمكن أن ينتجها محلل fore d peo‏ 
عند تشغيله على كلمة عربية رقمية خام» فإنه يمكن أن يعثر على تركيب صرفي 3D‏ 
تراكيب صرفية) تناظر كلمة (أو كلمات) عربية تقابل هذه الكلمة الخام وهو المسار 
الرئيسي الأول حسب JRA‏ رقم (Y-Y)‏ أدناه. 

يقودنا هذا المسار بدوره إلى أحد مسارين؛ إما إلى كلمة عربية مصرّفة أو كلمة عربية غير 
مصرّفة» ونبدأ بمسار الكلمة العربية المصرفة وهي ا حالة رقم ١‏ و ١‏ في الشكل رقم VAY)‏ 

فاللغة العرببة زرل ELI‏ الكاسحة من YELLS‏ إل هراد لغوية أولبة يُطلق عليها 
«جذور» وكل جذر منها هو عبارة عن؛ إما ثلاثة حروف - وهو الأكثر - ويسمى عندئلٍ 
(EY onn‏ مثل مادة (ن» صء ر)» أو أربعة حروف - وهو الأقل - ويسمى عندئذٍ 
tel der‏ مثل مادة (ع؛ o‏ ق» ل). وتتولد الكلمة من صب إحدى هذه المواد في 
أحد القوالب (Qe!)‏ الصرفية القياسية» والصيغة الصرفية هي كلمة بضبط صوتي كامل 
إلا أن عا ثلاثة حروف (إذا كانت صيغة للجذور الثلاثية) أو أربعة حروف (إذا كانت 
صيغة للجذور الرباعية) متغيرة قابلة لاستبداها بحروف الجذر عند صبه في هذه الصيغة. 

فصيغة «قَاعِل) على سبيل المثال هي صيغة تقبل الجذور الثلاثية وتكون حروف 
الفاء والعين واللام في الصيغة حروفا عامة تقبل lead‏ بحروف الجذر الثلاثي 
على الترتيب؛ فإذا صببنا على سبيل JL‏ جذر 09 ص ر » في هذه الصيغة 
(ف-نيع -ص» لحر) تتولد كلمة ol ol)‏ وبنفس الأسلوب إذا صببنا bale‏ (ع رق 
ل» في صيغة للجذور الرباعية مثل «فعاليل» - حيث يحل احرف الرابع من الجذر محل 
اللام الثانية من الصيغة الصرفية - تتولد كلمة 151569 وكذلك إذا صِبّت نفس المادة 
في الصيغة الفعلية Dno?‏ € تتولد كلمة «عَرْقَلٌَ)... وهكذا تسير عملية اشتقاق الغالبية 
العظمى من الكلمات العربية التي هي كلمات عربية منتظمة التصريف. 

إلى جانب ذلك يوجد عدد محدود Mer‏ (بضع مئات قليلة) من الكلمات العربية غير 
منتظمة التصريف S‏ منها نتيجة صب أحد الجذور في قالب صرفي غير قياسي 
(أي أنه قالب غير صالح لتوليد كلمات أخرى غير هذه الكلمة بالتحديد) أو ربا كان 
تصريفها قياسيًا في البداية ثم وقع شذوذ عنه ثم شاع الشذوذ - لسهولة نطقه مثلاً - (a‏ 


A, 


La‏ القياس. ومن أمثلة ذلك الكلمة الفعلية GBI‏ من مادة AD‏ خ» G‏ وكان المفترض 
أن يؤدي تصريفها القياسي إلى كلمة GES‏ على صيغة (GBI)‏ القياسية وذلك مثل 
نظيراتها xS‏ من «e Å)‏ ن) وكذلك Gs SS»‏ من D‏ م» ر)... إلخ. 

وسيل ذلك أن مسار الكلمة العربية 3B pall‏ يتفرع بدوره إلى أحد مسارين؛ 
إما إلى مسار الكلمة العربية منتظمة التصريف (المرقم ١ , ١‏ ني الشكل رقم (Y-Y‏ 
أو إلى مسار الكلمة العربية غير منتظمة التصريف (والمرقم ١١‏ ,؟ في نفس الشكل). 


Lil‏ مسار الكلمات العربية غير المصرفة - ورقمّه ١‏ ,۲ في الشكل رقم (۲-۳) - فهو 
يختص بنوعين من الكلمات لا تتولد نتيجة عملية صرفية كالتي عرضناها للتو» ولكنها 
دخلت اللغة كا هي على PUL‏ من حيث ثبات الهجاء والضبط الصوتي o)‏ باستثناء 
fad‏ الخركة الصوتية تية الإعرابية مع تغير المحل الإعرابي لما هو Fae‏ من هذه الكلمات). 
ويقودنا هذا المسار بدوره إلى أحد مسارين e‏ إما إلى كلمة جامدة وهي الحالة رقم Y, Y, ١‏ 
في الشكل رقم (۲-۳) coba‏ أو إلى كلمة معرّبة وهي ا حالة رقم Y LY , ١‏ نفس الشكل. 

GT‏ الكلمات الجامدة فهي بضع مئات قليلة من الكلمات العربية ES‏ عالية التكرار 
في النص العربي» وأغلبها أدوات كحروف جرء وحروف ناسخة» وأسماء BLE]‏ 
وأساء موصولة» وحروف cel‏ وضائر منفصلة ... SUS 9 l‏ مثل Op) (eyo‏ 
Sen et o b cd‏ ... إلخ. 

GT y‏ الكلمات Sal‏ فهي أيضًا بضع مئات قليلة من الكلمات التي دخلت اللغة 
العربية من لغات الحضارات المجاورة (كالفارسية والحبشية والسريانية 
والرومانية....) واستقرت فيها pos‏ عَدّل العرب من أصواتها لتلائم ذائقتهم 
اللغوية» وما يدل على استقرار هذه الألفاظ في اللغة العربية أن القرآن الكريم وقد 
نزل بلسان عرب مبين قد أورد بعضًا منها. ومن أمثلة تلك الكلمات المعرّبة؛ »7552« 
ope) D‏ الفارسية)ء (aes‏ (وأصلها حبشى)» ١مُوسَىء‏ 2 

000 lle nae ed aa) t]... 


-١‏ يحتوي القسمان الثالث والرابع من هذا الفصل على المزيد حول طبيعة البناء الصرفي للمفردات العربية. 
Y‏ - مثل كل أنواع الكلمات العربية» فإن هذه الكلمات غير المصرفة تقبل إضافة اللواصق إليها (من سوابق ولواحق) تحت 
شروط معينة» ويحتوي القسمان الثالث والرابع من هذا الفصل على المزيد حول هذا الأمر. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
)َُ6ا | ييا 


ومن الحام في هذا المقام الإشارة إلى أن اللغة العربية تعتمد أسلوبًا آحَرٌ Gla‏ للتعريب 
أكثر مرونة من هذه الفئة المحدودة من الكلمات المعَرّبة» ويعتمد هذا الأسلوب على 
اختيار الحروف الأربعة الأكثر Beal) God‏ الأجنبي وجعلها مادة لجذر رباعي يمكن 
تصريفه |S‏ سبق Ile a‏ الحالة رقم Y, Y, Y‏ فعلى سبيل المثال؛ الجذر الرباعي 
ow)‏ لواف ) ALS ROTE AT‏ الفرئسية SAUD‏ يرن ويي من THU GRID‏ 
Gale Gab‏ ... إلخ» كما أن الجذر الرباعي (ه 60 د» س) مستخلّصٌ من الكلمة 
الفارسية Gasp‏ ويشتق منه oa eg TERT, Tec‏ 


كلمة عربية رقمية خام 
-١‏ عربية سليمة 
à as ١١‏ 
V, Y‏ ,3 منتظمة 
BM [p] ' EA‏ 
1,1 ,1- غير منتظمة (استثناء C po‏ 


X e «55s أمثلة: لله‎ 


AY,‏ مصرّفة 
١١‏ جامدة 


... من مَعَهُمْ‎ «gl EROS] 
ine -Y Y, Y 


d E GEO) إبْرَاهِيمْ‎ con أمثلة:‎ 
a عير‎ 
أجنبية مكتوبة بحروف عربية‎ -١ , Y 
. ig 5 5 )}) فق‎ 
ibl -Y, Y 
8 p2 L è — — EM 


z 
Ge 


الشّكل YY‏ تصنيف ما يمكن أن تؤول إليه أية كلمة عربية رقمية خام بعد تحليلها صرفيًا. 


-١‏ من الأمثلة الأكثر حداثة أيضًا؛ الجذر الرباعي Å)‏ ت» م» ت) لتعريب كلمة automation»‏ الدالة على التشغيل الآلي 
أو التلقائي لمهمةٍ ماء وكذلك الجذر الرباعي (ق» و» ق» (J‏ من اسم شر كة «Google?‏ ليدل على البحث في »الشبكة 
العنكبوتية „Internt‏ 


وه وأ- 


-Y‏ طبيعة البناء الصرفي للمفردات العربية 

يحتوي جسم الكلمة العربية Blo‏ على جزء أساسي Glas‏ عليه اصطلاحًا اسم 
(Stem) gidh‏ وهو الجزء الذي جرى للتو عرض أصنافه وكيفية نشوء كل منها 
في القسم السابق. لكن الجذع لا يكوّن بمفرده الكلمة العربية في حالتها العامة» بل 
إنه يمكن أن يلتصق بجزء JT‏ يتقدم عليه ويُطْلّقَ عليه اصطلاحًا اسم «السابقة» 
eprefix))‏ كا يمكن أن يلتصق بالجذع جره IG‏ شعة وط عليه اصطلاحًا اسم 
«اللاحقة» (suffix)‏ ويَصْطلّح على تسمية السوابق واللواحق oly Us‏ 
(affixes)‏ . وبطبيعة الحال op‏ اللواصق تضاف إلى الجذع لإنتاج كلمة توائم ls‏ 
الوظيفية سياقها النحويّ وكي تكتمل دلالتها في السياق المعنوي PAU‏ 

فعلى سبيل المثال إذا كان لدينا جذع الكلمة (Olay)‏ - من مادة «ر ه (O‏ المصبوبة 
في الصيغة uel‏ «فعال» - فإن إضافة السابقة «ال» إليها ينتج كلمة BE Cols Jin‏ 
أضفنا إليها اللاحقة «ات» صارت MEAD‏ وفي حين أن السابقة في هذا 
JU st‏ قد أضافت سمّة التعريف فإن اللاحقة قد أضافت سمتي تي etl‏ والتأنيث» 
فإذا كانت هذه الكلمة قد وردت - على سبيل المثال - في عبارة (... مع أن هذه 
الرّمَانَاتِ الكبيرة كانت محل تساؤل منذ البداية ...) OB‏ إفادة السابقة في هذا السياق هو 
التعريف بغرض التخصيص؛ با يعني هذه الرهانات بالتحديد وليس أية رهانات 
أخرى» كما أن اللاحقة أفادت ا جمع ولأن m‏ تدل على غير Ble‏ فإنها قد 
استخدمت صيغة جع المؤنث» ونلاحظ كذلك ما تقتضيه سلامة التركيب النحوي 
من موافقة الصفة «الكبيرة» لموصوفها «الرهانات» من حيث التعريف والنوع (التأنيث 
في هذه Les (JL‏ احتفظت الصفة بالإفراد لكون موصوفها غير عاقل وياثل 
الصفة في ذلك Js‏ من اسم الإشارة «هذه» الذي يسبق الكلمة والفعل الذي 
يعود Ou b» e‏ 

ومن أجل حوسبة البنية الصرفية للكلمة العربية» علينا أن ننتبه إلى أربع مسائل 
أساسية وهي مسألة اللواصق المركبة» ومسألة ضمان عدم التنافر بين أي زوجين من 


-١‏ لاحظ التغير في سمة العدد بالنسبة للصفة واسم الإشارة والفعل عندما يكون الموصوف عاقلاً؛ كأن تصير العبارة كما 
يي: (... مع أن هؤلاء السيدات الكبيرات ES‏ محل ترحيب منذ البداية ...). 


-— 
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ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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الأجزاء الثلاثة لأية كلمة سليمة» ومسألة التأثير المتبادل في بنية الأجزاء الثلاثة عند 
التحامها في كلمة واحدة» ثم مسألة التوافق مع الفونولوجيا العربية عبر الإعلال 


-١ ,*‏ اللواصق البسيطة واللواصق المركبة 

فمن حيث المسألة الأولى» OB‏ السابقة قد تكون بسيطة ذات عنصر واحد؛ وذلك 
مثل CJ)‏ التعريف» (Gyo Al)‏ المضارّعة؛ .. . إلخ) كما أنها قد تكون مركبة من 
sg‏ عنصر واحد؛ وذلك مثل («بال)» (el. CS‏ وذلك كا في (lp Vu»‏ 

c E S VoU بال‎ SLI وكلالك هو‎ eod A عل‎ (€ gobi y 
قد تكون مركّبة؛‎ Vel الوا»» لهم)» .. . إلخ) ىا‎ (GO) عنصر واحد؛ وذلك مثل‎ ols 
على‎ (eA el] و‎ (QU sts» à إلخ) وذلك کا‎ Xe الوهماء‎ «QU» وذلك مثل‎ 
الترتيب.‎ 

وني حين أن المقاربة الأصعب تسلك سبيل توصيف اللواصق البسيطة فقط Egel‏ 
لبرمجيات التحليل الصرفي ومن نّم إلقاء عبء رد اللواصق المركبة إلى مكوناتها البسيطة 
على عاتق ALLL‏ الحاسوبية لتلك البرمجيات» فإن المقاربة الأيسر والأكثر واقعية تقوم 
pares‏ كل السوابق المركبة وكل اللواحق المركبة الممكنة ف اللغة العربية - وهو ECC‏ 
حك ode OT‏ كل منها رصع og dc Ba gt culta‏ يعد ذلك ca stl ie gl‏ 
في برمجيات التحليل الصرفي لكل من تلك اللواصق من حيث الهجاء والضبط الصوتي 
SII,‏ والفعل البنيوي وهذان العنصران الأخيران في التوصيف هما اللذان Uus‏ 
للمسألتين التاليتين. 

Y Y‏ - شروط التحام اللواصق بجذع الكلمة 

أما المسألة الثانية فهي of‏ التحام اللواصق بجذع الكلمة EY‏ أن يحقق شروط 
عدم التنافر بين أي جزأين من الأجزاء الثلاثة الأساسية للكلمة (السابقة 
JH‏ اللاحقة)؛ فيمكن - على سبيل المثال - أن تلتحم سابقة OD‏ التعريف مع 
جذع الكلمة الاسميٌ (صَالح) مع اللاحقة(ة» لتكوين الكلمة LD‏ 
لأن هذه الأجزاء الثلاثة لا يتنافر فيها أي زوجين» كا يمكن أيضًا على سبيل المثال 


ayes 


أن تلتحم سابقة C‏ المضارّعة مع جذع الكلمة الفعلي «تتاقس» مع اللاحقة (Q y‏ 
لإسناد الفعل المضارع إلى جمع المذكر ورفعه بثبوت النون لتكوين الكلمة CO ÉE‏ 
وذلك لأنه في كلا المثالين لا يتنافر أي جزأين من الأجزاء الثلاثة للكلمة. [ey‏ لا 
يمكن Ss‏ أن تلتحم سابقة «ي» de LAM‏ مع جذع الكلمة الاسمي e Lan‏ ولا 
يمكن كذلك ol‏ تجتمع في كلمة واحدة سابقة a)‏ للتسويف والمضارّعة | والتي 
تقتضي لزوم الفعل حالة الرفع - مع لاحقة الوا» التي تشير إلى حالة نصب أو جزم 
الفعل المضارع (أو الأمر) المسند لجمع المذكر. 

cde يسمل‎ cable ca ped pU yay هذه‎ js eae Jo 73 تق‎ ca SW 
أن يجري تعريف فئة محدودة من السات الأساسية - يكون عددها في‎ ola geg G pulo 
التي تغطي كل السمات التي يمكن أن تتخذها أي من السوابق‎ - ALI حدود عشرات‎ 
وكذلك يجري تعريف فئة أخرى للسمات الأساسية‎ Led] ... اسميةء حايدةء فعلية»‎ } 
على ذلك يجري إعداد جدول تبين خلاياه الحالة بين كل عنصرين من‎ Flay للواحق»‎ 
هاتين الفئتين من حيث التنافر (تحتوي الخلية عندئذٍ على صفر) أو التواؤم (وتحتوي‎ 
على واحد).‎ are 

- الحاسوبي لكل لاصقة‎ Cane gill BI إعداد برمجيات التحليل الصرفي‎ stil y 
لاحقة - شفراتٍ (أكواد) السمات التي تنطبق عليهاء وكذلك‎ el سواء كانت سابقة‎ 
يضمن التوصيف الحاسوبي لكل قالب صرفي (زيابة عن الجذع) السماتٍ غير المقبولة في‎ 
اللواصق التي تلتحم معه (وأحيانًا سمة يتحتم وجودها في اللاصقة التي تلتحم معه).‎ 
وتأسيسًا على كل ما سبق يمكن أن تتحقق برمجيات التحليل الصرفي في «وقت‎ 
إحدى السوابق مع إحدى اللواحق ببساطة عن طريق‎ gy من‎ runtime)) التشغيل)‎ 
وذلك بمراجعة الخلايا‎ iiU مع أية سمة‎ BUS التأكد أنه لا توجد أية سمة لِلاصقة‎ 
ee إليه عالِيّه» ويمكن بعد ذلك التأكد من أن توصيف‎ LAM المناسبة في الجدول‎ 
كل من السابقة واللاحقة لا يحتوي على أية سمة غير مرغوب فيها من قبل القالب‎ 
OF pall 


-١‏ وكذلك أن توصيف سمات كل من السابقة واللاحقة يحتوي على أية سمة يتحتم وجودها في القالب الصرفي. 
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-Y ۳‏ التأثير البنيوي المتبادل بين اللواصق والجذع 

وتتعلق المسألة الثالثة بأن السابقة والجذع عند التحامهم| يؤثران بشكل متبادل في 
Lea‏ البعض من حيث المجاء والضبط الصوتي» وكذلك هو SL‏ عند التحام الجذع 
واللاحقة cles‏ فعلى سبيل المثال؛ إذا التتحمت السابقة «بال» بالجذع OLA‏ (الناتج 
عن صب مادة الجذر «ق ص © القالب الصرفي «امْتعال») فإن ألف الوصل A‏ 
تتصدر الجذع تصير غير منطوقة (Glo‏ بسبب اتصاها بالسابقة قة (وهذا هو فعل السابقة 
الجذع) ولكن ذلك يؤدي إلى تتابع ساكتين (اللام في السابقة ة والقاف في الجذع) وهو 
WEL‏ القوانين الصوتية (الفونولوجية) العربية وللخروج من ذلك 352 الساكن 
peser ee a ee‏ 

هي SYD‏ . وعلى الجانب os‏ ]13 التحم الجذع (RS)‏ (الناتج عن صب 
e e jal sale‏ ت» في القالب op ge‏ مع اللاحقة )3( - وهي ضمير 
الرفع للمخاطبين - فإن هذه اللاحقة تقتضي تسكين آخر حروف الفعل الماضي وهي 
pu n D‏ 

تقتضى القوانين الصوتية ise‏ إدعابييا يكان حرف ضيه puel gei onda y)‏ 

ساد بع و a RM‏ 

وللتعامل G pulo‏ مع هذه المسألة فإنه يجري تعريف فئة محدودة العدد من التأثيرات 
التي يمثل كل منها SU‏ متبادَلاً بين بنية السابقة والجذع؛ كما يجري كذلك تعريف فئة 
أخرى محدودة العدد من التأثيرات التي يمثل كل منها Wi‏ متبادلاً بين بنية الجذع 
واللاحقة . ويكون کل من هده اتأثيرات في كلت call‏ عبارة عن إجراء حاسوبي مكون 
من خطوات مشروطة لتعديل بنْيتي الجزأين الملتحمين حسب ما يصادفه الإجراء من 
حروف وحركات في السابقة والصيغة الصرفية ال ملتحمتين أو الصيغة الصرفية واللاحقة 
ان . ويجري بطبيعة الحال تضمين رمز لهذا الإجراء في التوصيف الحاسوبي لكل 
لاصقة أثناء إعداد برمجيات التحليل cd pall‏ كا AB?‏ التوصيفٌ الحاسوبي لکل 
صيغة صرفية «راية) flag))‏ وهي عبارة عن رمز رقمي ينتمي لفئة محدودة العدد) قد 
تدخل قيمتها ضمن شروط تنفيذ بعض خطوات التأثيراتٍ L553 GLI‏ 


—\eg 


- الإعلال والإبدال والحذف 

أما المسألة الرابعة والأخيرة فهي متعلقة بتكوين جذع الكلمة عبر صب مادة الجذر 
في الصيغة الصرفية (وتسمى أيضًا «القالب الصرفي» وكذلك «الميزان الصرني»)» وهو 
ما مررنا عليه سريعًا في القسم السابق ونود هنا أن نلقي الضوء على مزيد من التفاصيل 
الحامة بخصوصه. فبالنسبة لعدد الصيغ الصرفية الأساسية في اللغة العربية بها فيها 
الصيغ الاسمية والفعلية ley‏ فيها صيغ الجذور الثلاثية والرباعية OP‏ عددها جميعًا قد 
يربو قليلاً على المئة صيغة» هذا بافتراض أن كل حروف الصيغة الصرفية المتغيرة ري 
التعويض عنها بشكل مباشر بحروف مادة الجذر وهي ا حالة التي عرضناها cis,‏ لها 
في القسم السابق» ولكن الأمر في الواقع أكثر تعقيدًا من ذلك. 

ولتفهم ذلك ينبغي علينا أن نتذكر أن الصرف طبقة لغوية تالية للطبقة الصوتية 
(الفونولوجية) وهذا يعني أن البناء الصرفي العربي محكوم بالقوانين الفونولوجية العربية» 
وني حين أن هذه القوانين لا تمنع التعويض المباشر في الحروف المتغيرة للصيغة الصرفية 
حين تكون الحروف في مواضع «صحَّة/ صحيحة)»؛ وذلك مثل صب مادة 
(ك» ثء O‏ في القالب الصرفي (Je n‏ حيث نحصل بالتعويض 
المباشر(ف pec‏ =ث» ل Ge‏ على جذع الكلمة KD‏ ولكن بعض الحروف قد 
تقع في مواضع tilo‏ أو مواضع «إبدال» صوتية وهو ما يجعل التعويض المباشر في هذه 
المواضع WHE‏ للقوانين الفونولوجية العربية فيتوجب ase‏ من أجل موافقتها تبديل 
الحرف عند أحد هذه المواضع بحرف آخر أو حتى latin‏ 

ونضرب لذلك بعض الأمثلة؛ فلو عوضنا بشكل مباشر عند صب مادة (س» ق» 
ي) في صيغة (SEI‏ لحصلنا على (ULI‏ وهو مستهجن فونولوجيًا في العربية 
لتطرف الياء بعد ألف ممدودة ما يقتضى Lb gd‏ إلى همزة لتصير «اسْتِسْقَاء». ولو عوضنا 
بشكل مباشر عند صب مادة (و» G‏ في صيغة (lade)‏ لحصلنا على ONG‏ وهو 
غير مقبول فونولوجيًا في العربية OM‏ الواو الساكنة تلي حركة الكسرة ولابد لها من 
أن تتحرك على نفس جنس هذه الحركة فتصير Sb‏ مدوة فنحصل على «ميلاد». ولو 
عوضنا بشكل مباشر عند صب مادة (ض» ر» ب) في صيغة had QU‏ على 
(IGS‏ وهو متعذر النطق لصعوبة الانتقال من خرج الضاد - وهو حرف مفخم 


—\+o- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
SSD O‏ 


- بعد السكون عليه إلى المخرج البعيد عنه للتاء - وهو حرف مرقق - فيتوجب لذلك 
تحريك حرف التاء إلى مفخمها فتصير طاءً يمكن الانتقال إليها A‏ بعد الضاد الساكنة 
فنحصل على «اضطِراب». ولو عوضنا بشكل مباشر عند صب مادة )ت» ل» BG‏ 
صيغة فعل الأمر Jai‏ لحصلنا على GD‏ - هذا بالطبع إذا لم تكن هناك لاحقةٌ بعد 
الفعل؛ أي إذا كان الأمر مسئّدًا إلى مفرّد مخاطب - وهو عسير النطق بسبب صعوبة 
المحافظة على تسكين الواو بعد حركة الضمة حيث أن الفونولوجيا حينئذ تدفع نحو 
تحريك الواو بالمد ولكن ذلك يطمس علامة إعراب الفعل المجزوم» ولذلك تحرف 
الواو كعلامة إعراب ونحصل على (ED‏ كفعل أمر مجزوم وعلامة ajg‏ حذف حرف 
العلة وهو الواو في مثالنا هذا. 

وتستلزم تغطية حالات الإعلال والإبدال والحذف في كل الصيغ الصرفية العربية 
إضافة توصيف حاسوبي Real‏ صرفية فرعية تصف كل منها حالة من تلك الحالاات» 
وعلى ذلك يتجاوز العدد ue MI‏ للصيغ الصرفية الألف بقليل» كا S‏ الحروف 
ار ا اا من tue gl‏ الخاسوي لكر ين هده الضيع gi‏ ادل عل 
ما إذا كانت صحيحة أو معتلة أو محذوفة فضلا بالطبع عن ترتيب كل منها بالمناظرة 
مع حروف الجذور. وجدير SUL‏ أن التوصيف الصوتي للصيغة الصرفية هو ذاته 
التوصيف الصوتي لكل الجذوع التي يمكن أن تنتج عن صب مادة أي جذر فيهاء ONS‏ 
محدّدات ALU‏ التحام هذه الجذوع Gel Wh‏ - كا سبق التنويه إليه في القسم الفرعي 
قبل السابق - يتضمنها أيضًا التوصيف الحاسوبي للصيغة الصرفية O‏ 


4ت الضيغة Aled!‏ العامة للكلمة العربية 


zb‏ على كل ما عرضناه في القسمين السابقين (الثاني والثالث) من هذا الفصلء فإن 
الكلمة العربية تتولد عبر الخطوات الثلاث التالية: 

أ. ai‏ أولاً مادةٌ إحدى الجذور في إحدى الصيغ الصرفية التي يسمح توصيفها 

الحاسوبي باستقباله (وفق القوانين الفونولوجية العربية) وذلك لإنتاج جذع 


١-لمزيد‏ من التفاصيل التقنية الدقيقة لكل ما ورد في هذا القسم يمكن الاطلاع على الفصل الخامس بالمرجع رقم [1o]‏ 
فى قائمة المراجع ble‏ هذا الكتاب. 


ع5 \-— 


الكلمة» ونرمز هذه العملية كما يلى: 

جذع كلمة = جذر CC)‏ صيغة صرفية 

بين السابقة والصيغة الصرفية للجذع» مع أخذ التأثير البنيوي المتبادل بين 
السابقة والجذع في الاعتبار» ونرمز لذلك كا يلي: 

سابقة CD‏ -+جذع كلمة = سابقة 9©->(جذر C)‏ — صيغة صرفية) 

ج تلتحم إحدى اللواحق مع الناتج من الخطوة السابقة إذا تحققت شروط عدم 
التنافر بين اللاحق والصيغة الصرفية» مع أخذ التأثير البنيوي المتبادل في 
الاعتبار» فنحصل بذلك على الكلمة في شكلها النهائى. ويمكننا صياغة هذه 
الخطوات Éj‏ ىا يلي: 


كلمة عربية = Ou © WL‏ صيغة صرفية)” © لاحقة 


الشّكل (P-Y‏ الصيغة البنائية العامة للكلمة العربية. 


dx,‏ هذه Gall‏ ركيزةً أساسية لحوسبة الصرف العربي عبر برمجيات التحليل 
الصرني العربي» هذا بالطبع شريطة أن تستطيع بالفعل استيعابَ أية كلمة تقع تحت أي 
من أصناف «الكلمات العربية السليمة» المبيّنة في الشكل رقم le (TV)‏ ففي حين 
أن القسم السابق قد أوضح بالتفصيل Bo‏ توصيف هذه الصيغة البنائية لبنية الكلمات 
العربية منتظمة التصريف» فإنها أيضًا تنطبق على الكلمات العربية استثنائية التصريف 
حيث يكون جذع كل استثناء صرفي حالة فريدة لا تقبل معه الصيغة الصرفية الاستثنائية 
Cail‏ فيها إلا جذر وحيد ولذلك OB‏ توصيفها الهجائي لا يحتوي على أية حروف 


متغرة. 


ويتبقى OVI‏ نوعان من CIS‏ العربية غير المصرفة؛ وهما SIS‏ الجامدة 
(وعددها مئات قليلة) والكلمات المعرّبة (وعددها كذلك مئات قليلة)» وكلاهما بحاجة 
إلى أن يجد مكانًا وتفسيرًا في هذه الصيغة البنائية العامة للكلمة العربية. [i‏ 
ناحية الصيغة الصرفية فمن الواضح أنه يمكن مناظرتها بسهولة - في كلا النوعين - 


— \ Ve 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
5 — ييا 


بحالة الاستثناء الصرني أي أن ن الجذع الجامد أو المعَرّب يلعب هو نفسه دور الصيغة 
الصرفية بلا أية > Gy‏ متغيرة» أما على ناحية الجذر فيبدو لأول وهلة أنه عديم القيمة 
لأنه لا يلعب دورًا في توليد الجذع ولا الكلمة» ولكننا نستطيع أن نعطيه دورًا قد يفيد 
في بعض التطبيقات للمعالجة الحاسوبية للغة العربية. 

فمن المفيد بالنسبة للجوامد أن ننظر إلى المترابط منها وظيفيًا كعائلة ننتخب إحداها 
(ويفضّل أن يكون أبسطها تركيباء أو أكثرها شيوعًا) كجذر لهذه العائلة» فعلى 
سبيل المثال؛ الأسماء الموصولة Cg ecu cod cst an ain)‏ 
يمكن أن ننظر إليها كعائلة ونضع ها جذرًا وليكن oh gl‏ كما يمكن أن ننظر إلى ضهائر 
الرفع المنفصلة في حالة الخطاب (Sb ees «b TR ESD}‏ كعائلة 
ونضع لها جذرًا وليكن MEST‏ ... وهكذا. وفي حالة وجود جامدة غير مرتبطة بغيرها 
من الجوامد فإن الجذر ببساطة يكون مساويًا للجذع وكفى. 

أما في حالة الكلءات المعرّبة فتلك العائلات تضم إما الكلمة المعرّبة بمفردهاء 
أو الكلمة المعرّبة بتفرعاتها الحجائية المختلفة؛ وذلك مثل [«مُوسيقى)» «مُوسيقا»» 
ENA‏ ونضع ها de‏ وليكن «JU es, To‏ «ميكائيل)؛ 
S LC a‏ ونضع لها جذرًا وليكن «ميخائيل)» ... وهكذا. 

ويفيد تجميع هذه OUT‏ في عائلات في بعض التطبيقات الحاسوبية الهامة لمعالجحة 
اللغة العربية؛ ومنها على سبيل المثال «البحث في النصوص العربية»» و«استرجاع 
المعلومات»» وكذلك في بعض نواحي التحليل الدلالي العربي. 

وتأسيسًا على كل ما تقدَّمَ فإنه إذا توافر لدينا جذرٌ وصيغةٌ صرفيةٌ» Bile‏ ولاحقة 
فإننا نستطيع عبر الصيغة البنائية العامة للكلمة العربية أن نقوم حاسوبيًا بتركيب الكلمة 
العربية المناظرة لتلك SL GUI‏ (بافتراض عدم تنافرها)» مع التنويه أننا بالطبع 
نحتاج أيضًالمعرفة نوع الكلمة العربية من أجل تقرير كيفية تركيب جذعها من 
جذرها وصيغتها الصرفية» ولذلك فإن التركيب (نوع الكلمة: RR SUE‏ الجذرء 
الصيغة الصرفية» اللاحقة) هو تمثِيلٌ GIS‏ ومكافيٌ للكلمة العربية» مع ملاحظة أن 
غياب السابقة عن أية كلمة as‏ بحد ذاته سابقة (سابقة فارغة null‏ 
(prefix‏ وبالمثل فإن غياب اللاحقة في أية كلمة يعتبّر لاحقة (لاحقة فارغة 


zx 4 Kes 


. (null suffix 
55$ ومن الواضح في هذا التمثيل المعلوماتي أنه يكفي ذكر «الكود» الرقمي لكل‎ 
من هذه المكوّنات الخمس والذي يُمْكِن من خلاله الوصولٌ إلى التوصيف الحاسوبي‎ 

الكامل لهذا المكون في برمجيات التحليل الصرفي. 


ه- حجم حصيلة المفردات العربية 

ماهو حجم (vocabulary) (ols ae de>)‏ اللغة العربية؟ 

رَعُمَ أن هذا السؤال يبدو Éy‏ بسيطاء إلا أن صياغته تحتاج أولاً إلى المزيد من 
التحديد. 

ls‏ أن إجابته بعد ذلك تحتاج إلى نظر عميق وتفصيل! 

فمن حيث تحديد «JI s‏ فهناك حصيلة المفردات على e PO" Cal»‏ وهناك حصيلة 
المفردات على «السماع», وبين الاثنتين فارق في الحجم كبير. 

فحصيلة المفردات العربية القياسية تشمل كل الكلمات العربية السليمة الممكن 
LA 5‏ من المكوّنات الصرفية العربية الأساسية - أيْ؛ gl‏ والصَّيّعْ الصرفية» 
والسوابق» واللواحق - e‏ آليات وضوابط التوليد والالتحام السالف ذكرها في القسم 
السابق» أما حصيلة المفردات العربية السماعية فهى تشمل كل الكلمات العربية السليمة 
التى استخدمها بالفعل الناطقون باللغة العربية تحدثًا وكتابة على مر ختلف العصور do‏ 
ike‏ المجالات cab Gy‏ المناطق الجغرافية وعبر مختلف أساليب التحدث (سردّاء 
Ml s‏ وخطابة...). 

Ul‏ على جانب تقدير حجم حصيلة المفردات على القياس» فإن المحاولات المعتبرة 
لبناء برمجيات الصرف العربي LES‏ أن أحجام فئات coU SU‏ الأساسية (اللّبنات) لبناء 
الكلمات العربية هى في الحدود التالية: 

عدد الجذور المصرّفة © 2 **0,£ 


-١‏ بعض المعاجم العربية المطوّلة [] التي تُعْنَى بجمع كل الروايات تصل ببذا العدد إلى حوالي تسعة آلاف ode‏ ولكن 


- ١٠0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


eo ~ الصرفية المنتظمة الأساسية‎ avail ote 
EXE i (OX lll عدد جميع الصيغ الصرفية‎ 
Yo: = عدد الاستثناءات الصرفية‎ 
Vas 8 عدد الحوامد‎ 
ع‎ = ob Fall sds 
Ye ° عدد السوابق (البسيطة والمركبة)‎ 
TP 9 اللو احق (البسيطة والمركبة)‎ sue 


ومن هذه الأرقام نستطيع أن نقدر مجموع عدد الجذوع العربية الممكن توليدها 
بحوالي النصف مليون جذع وهو حاصل ضرب عدد الصيغ الصرفية الأساسية”" 
في ote‏ الجذور المصرفة» ويلاحظ بالطبع أن ote‏ الاستثناءات الصرفية والجوامد 
والمعرّبات معًا في حدود AV‏ وهو عدد مهمّل بالنسبة لنصف مليون. 

أما بالنسبة لِلّواصق فإن عدد الأزواج dal) FM‏ لاحقة) غير المتنافرة 
التي يمكن أن تجتمع في كلمة عربية سليمة واحدة هو بالتأكيد أقل من حاصل 
ضرب عدد السوابق في عدد اللواحق» وبالتالي فإن عدد هذه الأزواج  Pee)‏ 
te + Cool ×‏ حيث يمكن أن نعتبر (ع) معاملاً Bla‏ وتقدر بعض الدراسات 
الحاسوبية وكذلك بعض استقراءات السات الأساسية للواصق أن قيمة «ع» تقع بين 
الثغانية والعشرة؛ وعلى ذلك نستطيع أن نقدّر أن عدد هذه الأزواج الأزواج ^ Y‏ × 
VA, 00024 + (00:‏ زوجًا. 

وبا أن BIS‏ الجذوع الممكن توليدها تكاد تنقسم بالتساوي بين اسمية وفعلية» OB‏ 
العدد الكلي للكلمات الناتجة من التحام الجذوع بأزواج اللواصق يمكن تقديره تقريبيًا 


تمحيص وغربلة كل coll JI‏ - لاستبعاد المكرّر والمصّحَّف ... إلخ - تثمر عن عدد بين أربعة آلاف وخسة آلاف 
جذر مصرّف. 

-١‏ ويغطي هذا العدد الحالات الأساسية OVE BIS SUA]‏ الإعلال والإبدال والحذف. 

ote -Y‏ المشتقات الممكنة من صب الجذر الواحد المصرّف في كل الصيغ الصرفية (بكل حالات الإعلال والإبدال 
والحذف) يساوي فقط عدد الصيغ الصرفية الأساسية» ولذلك استخدمنا هذا العددَ في حاصل الضرب. 


۰ - 


LIS ٤و٠٠,‎ ree ene =+ (oen ٠٠١ ×۱۸, tt) عبر حاصل الضرب‎ 
رن‎ ciuis iu D. رو آخر‎ gf كلمت‎ CO gale Ronde y GT desl أى‎ se 
((Vocabulary Space كلمة. ويشكل هذا العدد المهول حجم «فضاء المفردات»‎ 

العربية الذي EY‏ أن تنتمي إليه أية كلمة عربية سليمة. 


وعلى الجانب الآخر لتقدير حجم حصيلة المفردات على السماع» فمن الواضح أن 
هذه الحصيلة السماعية تحتل مجحرد حيز جزئي من فضاء المفردات العربية (الحصيلة 
القياسية)» ولكننا نحتاج من أجل تحديد eer‏ السماعية إلى تجميع ثم دراسة ما 
CS‏ وما قيل بالعربية عبر الأبعاد الأربعة الأساسية التالية: 


البعد الزمني: حيث أنه كلا مر الزمن» A‏ استخدام كلمات من فضاء المفردات 
العربية لى تكن مسموعة من ae‏ ومن أمثلة هذه الكلمات gl a‏ 
انتقلت إلى الحصيلة الساعية حديثا؛ (obs‏ و«حاسوب)» «(SO‏ 
و«الرَسْمَلَة) و STAND‏ ... إلخ. 


. البعد الجغرافي: حيث يشيع استخدام US‏ عربية سليمة في مناطق عربية 


معيّنة leg‏ هي مهجورة أو نادرة الاستخدام في باقي المناطق» فعلى سبيل JEU‏ 
تستخدّم في المغرب العربي دون غيره من GUL‏ العربية CLUS‏ عربيةٌ سليمة 
fe £ 5 85 pa‏ د £2 
مثل؛ «تظاهرة» (مناسبة Tole‏ مثل المعرض أو المهرجان)» CEERI g‏ (هيئة أو 
سلطة التفتيش)» و«الفارط» (صفة PASE‏ مع الأزمنة كالشهر والسنة بمعنى 
السابق أو الفائت)» 85505( )23 Que‏ «حَرّاقة) (مهاجرون غير شرعيين في 


. البعدالموضوعي: حيث تُسْتَضْدَم كلمات عربية سليمة كاصطلاحات 


في مجحالات/ موضوعات بعينها e‏ يقل أو ينعدم ذكرها فيما سواها 
من /oNLe‏ موضوعات؛ ومن il‏ هذه الكلات A AND‏ علوم 
الأحياء والكيمياء العضوية)» و «الاتتكال» (في علوم الكيمياء 
وهندسة المعادن)ء و«الاختباك G)‏ مجال البلاغة)» و D «ato‏ العلوم 


£ 


Y 


-١‏ هذا بالطبع إضافة إلى تلك الكلمات المسموعة بالفعل والتي تكتسب دلالات جديدة مع مرور الزمن. 


yop es 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
)َُ6ا ب ييا 


العسكرية) ... إلخ. 


د. البعد الأسلوبي: حيث تختلف الكلمات المستخدمة مع أسلوب الكلام ففي 
الأسلوب 28 59( يغلب Ste‏ إسناد الأفعال للغائب؛ مثل SEY‏ «قالوا»» 
«ash Me LA‏ ... إلخ» كما يندر الإسناد للسكلم والمخاطبء ويندر 
استخدام صيغة الأمر» ويندر استخدام أدوات النداء ... إلخ» Ul‏ الأسلوب 
eol‏ يكثر إسناد الأفعال للمخاطب» كا يمكن مصادفة الإسناد للمتكلم» 
ويمكن Boles‏ أفعال الأمرء ... إلخ» وكذلك يتميز الأسلوب Ble‏ 
بمفردات خاصة» ... وهكذا. 

نحتاج إذن لجمع ما قبل وما كتب بالعربية على امتداد هذه الأبعاد الأربعة من أجل 

doe y (ar kasdi La pall cola dll Ulnar ga leal‏ وق تين أن حص وعد 
cola jal‏ هو أمر متيسر حاسوبيًاء OL‏ مهمة الجمع غير هينة IÍ‏ ليس فقط لضخامة 
الحجم بل أيضًا OY‏ الكثير من نطاقات الأبعاد السابق ذكرها غير مغطاة رقميًا بشكل 

tls‏ وذلك مثل اللغة التراثية» والأسلوب الحواري. 


يمكن طرح عمليات الجمع والحصر والعد السابق ذكرها كمشروع كبير مقترح يتعاون فيه 
Oy gall‏ لاي MM cols all‏ ا dade y ce‏ 
حيث أن ذلك العمل لم يتم بشكل مستوفٍ حتى تاريخ كتابة هذه السطور. 


وأا ما كان التقدير الدقيق لحجم الحصيلة السماعية - التي تتراوح تقديراتها CEA‏ 
بين الواحد في الألف والواحد في المئة من حجم فضاء المفردات العربية - فإنه يمكن 
بثقة تقرير عدد من الحقائق الحامة: 
أ. إن فضاء المفردات العربية ذو حجم هائل. 
ب. إن حصيلة المفردات العربية السماعية ما زالت تمثل جزءًا ضئيلاً من فضاء 
المفردات العربية. 
ج. إن حصيلة المفردات العربية السماعية بالرغم من ذلك ذات حجم ضخم (يقدر 
بملايين الكلمات حسب أكثر التقديرات تواضعًا) يفوق حجم حصيلة المفردات 
السماعية في لغات العام الحية الكبرى» ولذلك فإن تلك الحصيلة تحتاج عادة إلى 


-\\ es 


مزيدٍ من العمل vidue. oe)‏ عار الكبرى co‏ 


o].‏ الساحات غير المخد i ues dy pall lo al clad G‏ جدا وتشكل 

& A) sl oco NI تمن‎ Leaf الله‎ 2, Key Coes a] Chadd Cb Let 

للاحتياجات الاصطلاحية الراهنة والمستقبلية في مختلف مجالات النشاط 
الإنساني» وذلك في تواصل مطرد بسلاسة مع التاريخ العريق الممتد اللغة. 


5- تعريف التحليل الصرفي JI‏ وتطبيقاته 

alas‏ دلالات كلمة «مُورْفُولُوجى» (Morphology)‏ بمظهر وشكل الشىء/ 
StH‏ وكذا فف au deal yay [Stall Jo at‏ مت «di Log cs A SM ol MI‏ 
وتسشتخدم الكلمة بشكل اصطلاحي في عدة مجالات مختلفة؛ ففي علم الأحياء على سبيل 
المثال يعني الاصطلاح دراسة مظهر وشكل وتركيب CAI PIS‏ هو وأعضائه”"2, أما 
في Jle‏ علوم اللغة OG‏ الاصطلاح يعني دراسة بنية الكلمات وآلية توليدها من مكوناتها 
الأساسية وهو ما يَعْرّف في العربية بعلم الصَّرْف. 

ومن خلال ما استعرّضَنْه الأقسامٌ السابقة من هذا الفصل يتبين الانتظامٌ العاليء 
وکال القدرة التوليدية المائلة لنظام الصرف العربي عبر صب الجذور في seal‏ 
الصرفية لإنتاج الجذوع ثم التحام هذه الجذوع مع اللواصق لتوليد آلاف الملايين 
)**0,£ مليون) من الكلمات وذلك من خلال استخدام عدة آلاف قليلة فقط 
C, Ve»)‏ من SUSU‏ الصرفية» ويمكن تقديرٌ oles‏ للتوليد الصرفي بخارج قسمة 
العددين = TAY‏ مليون» وهو معامل هائل بكل معايير اللغات المعروفة! 

Sy‏ هذه القدرة التوليدية الصرفية العظيمة في اللغة العربية ميزةً كبرى في صالح 
تعلّم GU‏ العربية وكذلك ميزة كبرى لتطبيقات معالجتها حاسوبيًا ىما سوف يلي 
توضيحه لاحقا في هذا qual‏ ولكن علينا قبل ذلك الانتباه إلى أن التحليل - وليس 
التوليد - هو المسألة الصرفية الطبيعية في معالجة eS pele lo pall‏ ذلك أن الشكل 


-١‏ بينم Physiology (J Lh GA‏ في علم الأحياء بالوظائف الحيوية للكائن ولأعضائه. 


salve 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
05 ييا 


اللغوي الذي ينتجه البشر بشكل طبيعي والمستهدّف معالجتةُ G pulo‏ هو النص (أو 
الكلام) والذي هو عبارة عن ساسلة من الكلمات المولّدة بالفعل» والمطلوب من هذه 
Sue‏ الكلات e‏ البنائية الأساسية. 


اتعريف الرظيفي der‏ صرق عر hs‏ كم في الشكل رقم (۴- ‘sal C£‏ 


كلمة عربية | تحليل صرفي |-> (نوع الكلمة: السابقةء GALI‏ الصيغة الصرفية» اللاحقة) 
الشّكل ٠-۳‏ : التعريف الوظيفي لنظام التحليل الصرفي العربي. 
Sy‏ هنا إلى أنه في العادة يكتفي المحلل الصرفي بإخراج «أكواد» كل من المكونات 
الصرفية Lela‏ الخمس الى يمكن ARE‏ الوضول إل ne gl‏ الحاسوي لكل فن 
هذه المكونات في برمجيات التحليل الصرفي العربي. ويعرض الجدول رقم )١- =Y)‏ أدناه 
عينة من OES‏ أحد برمجيات التحليل الصرفي العر OG‏ 
عند هذه النقطة وقد اتضحت البنية الصرفية للمفردات العربية وصار لدينا تعريف 


محدد للتحليل الصرفي العربي» من الطبيعي أن نتساءل عن أهمية حوسبة التحليل الصرفي 
العربي وفوائده التطبيقية. 


kat ud ا‎ ag Du 
على دَوْر الصرف في كل من‎ LAYI العربية تضفيان مزيدًا من‎ BY OUS هما ميزتان‎ 

استخدامها البشري وكذلك EL.‏ الحاسوبية» حيث تشكلان ee‏ ركيزة لغوية 

للناطقين بالعربية ومتعلميهاء ىا تمثلان محورًا للعديد من تطبيقات المعالجة الحاسوبية 


الا 
الكلمة نوعها السابقة الجذر الصيغة الصرفية | اللاحقة 
e u Ji f -‏ 
é‏ جامدة 0 e‏ 
٠ £A AV Y i‏ 


-١‏ وهو الموصوف في المرجعين رقم ]١5[‏ ورقم GENT‏ قائمة المراجع ale‏ هذا الكتاب. 


-\\é- 


| الكلمة نوعها السابقة الجذر الصيغة الصرفية اللاحقة‎ 
له‎ jes مصرّفة 3 نول‎ Race 
A wai Evy 3 منتظمة‎ B 
ات‎ JU a Qus | مصرّفة‎ PE 
j GESI 
Yy 4 fros q منتظمة‎ ace 
8 فعل‎ ede مصرّفة ال‎ PES 
3 العلمة‎ 
YA ALY Vo q منتظمة‎ UT 
E من‎ ip L 
جامد‎ 
: ۱۱۸ 3 : E o 
5 pels مصدّفة = وضع‎ 
2 | 
. ay 4 . منتظمة‎ ere 
4 A al = استثناء‎ 5 
3 ۱۳ ۳۹ . d WE 


الجدول Y - Y‏ : أمثلة على التحليل الصرفي لبعض الكلمات العربية. 

فالملكات اللغوية للناطقين باللسان العربي تتشكل het by‏ أن السيطرة الذهنية 
على الحصيلة اللغوية old‏ الحجم الضخم لا تقوم فقط على حفظ واستظهار مفرداتها 
بمعزل عن بعضها البعض بل تقوم إلى حد بعيد على الترابط البنائي والدلالي المتين 
بين هذه المفردات؛ نمر ا على سبيل Jti‏ أن a‏ مثل Me glen Molen}‏ 
ue» A XA ein «uii cl gles‏ ..{- - والتي à 2s S‏ الجذر e‏ ل م 
- تدور جميعها حول معنى مشترك عام (وهو المعرفة والفهم) وذلك على الرغم من 
أن لكل منها دلالة تفصيلية dake‏ كا أن SIS‏ مثل Saari d‏ 
(Laser)‏ «استنصار)»» OES)‏ «اشتطلاع».. ..{- - والتي 3“ à d s‏ القالب 


GOVT انتبه علماء اللغة العرب منذ وقت باكر (راجع مثلاً «ابن فارس» في قاموسه «مقاييس اللغة» وهو المرجع رقم‎ -١ 
قائمة المراجع نهاية هذا الكتاب) إلى أن الجذوع المشتقة من كل جذر مصرَّف تدور حول عدد قليل من المعاني الكلية‎ 
نادرة يزيد عدد هذه المعاني الكلية عن ذلك). وقد جرى استثار هذه الحقيقة‎ SVE (واحد أو اثنين أو ثلاثة» وفي‎ 
له الفصل الأول من الباب السادس‎ agu الحامة في الأعمال الحديثة لحوسبة «الدلالات المعجمية العربية» وهو ما‎ 
«التحليل الدلالي» في هذا الكتاب.‎ 

ولتكملة الإفادة من JE‏ المضروب على جذر O‏ ل cte‏ فإن له - حسب «مقاييس ابن فارس» أيضًا - معنى كليًا آخر 
وهو AD‏ يتميز عن سواه) ومن مشتقات الجذر التي تدور حول هذا المعنى Meher} ASI‏ «أغلام»» cl pla)‏ 
i. «QU‏ 


—\\o- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—.- 9‏ 


الصرفي (UD‏ - تحمل le Us Beale lese‏ (وهو طلب الشيء والسعي 
لتحصيله)» كما أن اللواصق تحمل دلالات ووظائف نحوية محدّدة sake las OU co].‏ 
قليل VM‏ من ou‏ الصرفية (عدة آلاف) مع إتقان ضوابط التفاعلات بين هذه 
اللبنات يمكن المرء من السيطرة الدلالية والبنائية على الحصيلة اللغوية العربية هائلة 
الحجم Gy)‏ الملايين LO Con Sy‏ ييسر عليه القراءة والفهم وكذلك التعبير والكتابة. 
Ul‏ بالنسبة LLL‏ اللغة العربية حاسوبيًا ob‏ أهمية الحصول de‏ محلل صرفي عربي 
آلي تكمن في اختصار العبء الثقيل للتعامل مع العدد المائل من حصيلة مفردات اللغة 
العربية عبر تفكيكها إلى عدد محدود من اللبنات الصرفية العربية الأولية. وم dus‏ 
الاعتماد على التحليل الصرني العربي الآلي؛ OP‏ بعض التطبيقات للمعالجة الحاسوبية 
AT‏ العربية حورها الأساسي هو التحليل الصرفي العربيء lex‏ بعض التطبيقات 
الأخرى يكون التحليل الصرفي العربي الآلي وسيلة ضرورية أو مساعدةً لإنجازها. 


ومن بين التطبيقات الحاسوبية التي تنتمي للنوع الأول؛ SE‏ على سبيل المثال لا 
ال حصر: 

J‏ دعم وظائف البحث الاشتقاقي العربي في محركات البحث النصي: فالمستخدم 
عندما يبحث عن كلمةٍ ما في نطاق (eai‏ معين؛ ولتكن كلمة lee‏ على سبيل 
JU‏ فإنه كثيرًا ما يرغب في الحصول ضمن نتائج بحثه على مواقع كلماتٍ 
مثل «اعتمادات»» cope YU»‏ «واعتادهم»» «الاعتادية» ... وكل SAS‏ 
الأخرى المشتركة في نفس الجذع والواردة في نطاق البحث (ويسمى ذلك 
«نمط البحث على مستوى الجذع»2)» وقد يود المستخدم توسيع نتائج البحث 
حتى يحصل BLS)‏ على ما سبق على مواقع کل ات مثل «يعتمدونه»)» (معتمدا» 
color‏ «العمود» ... وكل الكلمات الأخرى المشتركة في نفس الجذر والواردة 
كذلك في نطاق البحث (ويسمى ذلك «نمط البحث على مستوى (OIE‏ 
... وهكذا. 


-١‏ كما جرى تفصيلّه في القسم السابق من هذا الفصل؛ فإن تقدير حجم الحصيلة اللغوية العربية القياسية قد يصل إلى 
أربعة ونصف بليون كلمة» بينم تتراوح التقديرات «الجزافية» لحجم الحصيلة اللغوية العربية السماعية بين بضعة ملايين 
(كحد أدنى) وعشرات الملايين (كحد أقصى) من الكلمات. 


AP E 


ب. الربط المعجمي العربي الآلي: فالقارئ للنص العربي إلكترونيًا ربا يحتاج إلى 
شروح لبعض المفردات التي تصادفه» ولكن مداخل المعاجم العربية هي مواد 
الجذور (وليست الكلمات - نظرًا لاتساع الحصيلة اللغوية العربية السابق 
0553( والتي يتطلب الوصولٌ إليها استخدامَ التحليل الصرفي الآلي» ويتيح هذا 
الاستخدام أيضًا فرصة إضافة مداخل أخرى لشرح الصيغ الصرفية واللواصق 
ما يستوفي شرح المفردة من كافة زواياها. 

ج. التحليل JYS‏ المعجمي العربي: يكاد يكون من المستحيل تغطية كل المفردات 
العربية ككلماتٍ تامةٍ - وذلك مرةً أخرى بسبب ضخامة حجم حصيلتها - 
بشكل OUS‏ في قاعدة بيانات det ye‏ ترتبط فيها كل مفردة با يناسبها من 
حقول دلالية glu)‏ عامّة) كما ترتبط عبر علاقات دلالية ببعضها البعض» 
ولذلك JAS‏ الكلمات LS FLW‏ صرفية أكثرٌ مرونة منها تسمح بتغطية 
مفردات اللغة العربية بنسبة عالية في أية قاعدة بيانات للربط SYM‏ ىا 
يستخدم التحليل الصرفي الآلي للعبور من كلمات النصوص pall‏ دراستها 
دلاليًا إلى هذه التركيبات الصرفية(١).‏ 

Molen! a‏ تساعد في Uo pasty cis pall SAU pled‏ فلك اة باهحاء/ 
الإملاء» 1B pall gles‏ 

وكذلك العديد من التطبيقات الأخرى التي يشكّل التحليل الصرفي العربي 

الآ عور ١ get‏ 
ALLL colis ile fe Lil‏ ا اسر Ra ll BAU‏ ل pall deed‏ 
العربي JY‏ وسيلة ضرورية أو مساعِدةً لإنجازها فمن أمثلتها؛ «تشكيل النْصّ 
Diacritization) (a ad‏ 6 (حيث تحتوي نواتج التحليل الصرني لكل 
كلمة على «سابقة» + «صيغة صرفية» + «لاحقة» es‏ وبعد تطبيق التأثيرات البنيوية 
لالتحامها على التشكيل الصوتي للكلمة ما عدا الحركة الصوتية الإعرابية أحيانًا)", 


-١‏ للمزيد حول ذلك الموضوع يمكن الرجوع إلى الفصل الخامس «التحليل الدلالي» في هذا الكتاب. 
ai -Y‏ بذلك النظم الآلية لاستنباط علامات الضبط الصوتي SUS‏ نص عرب ما. 
۳- وهو بدوره يدخل في نظم معالجة لغوية أخرى؛ من بينها على سبيل المثال «تخليق الكلام المنطوق من النص العربي 
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وكذلك التدقيق الإملائي في النص العربي GLESY)‏ مواضع الأخطاء الإملائية و/ 
أو a‏ .... إلخ. 

ويجادل البعض بعدم الحاجة إلى عملية التحليل pall‏ في التطبيقات التي يمثل 
التحليل الصرفي العربي JYI‏ وسيلة لإنجازهاء وبأن مثل هذه التطبيقات يكفيها 
الاقتصار على التعامل مع حصيلة المفردات العربية التامة بشكل مباشر عبر استقرائها 
من مدوّنات نصية عربية موسّعة وبتوظيف أساليب حاسوبية إحصائية وبالتعويل على 
القدرات الكبيرة (والمتصاعدة) للأجيال الحالية من الحاسبات الرقمية» ولكن أرفع 
الأبحاث المدققة بينت حديثًا أن تغطية حصيلة المفردات العربية لا يمكن تحقيقها 
حاسوبيًا بشكل مُرْضٍ oly‏ أكفأ وأكمل ا حلول العملية المتاحة تتكون من مزيج/ هجين 
من كلا التو جهين27. 


- التركيب الصرف معيرًا لحوسبة التحليل الصرفى 

كيف يجري تنفيذ التحليل الصرفي العربي TÉ pl‏ 

من أفضل المقارّبات الرياضية المحكّمة في علم الذكاء الاصطناعي التي يمكن 
استعارتها لإجراء التحليل الصرني حاسوبيًا بكفاءةٍ أسلوبٌ يُعْرَف باسم «التقييد 
المتعاقب) «(Successive Constraining)‏ وتقوم فكرته الأساسية على آليتين تعملان 
اها | cold Je LAY‏ عق كل الخلول D lle oj all‏ مسويات 
متصاعدة) من المسألة قيد البحث ومن ثم تضيفها إلى فضاء الحلول الممكنة» وثانيته| 
تختبر هذه الفرضيات مقابل القيود التي لا بد أن يلتزم بها أي حل مقبول للمسألة ومن 


7o 
eror y 


2255 تحذفها من فضاء الحلول الممكنة» وتعمل هاتان الآليتان بالتعاقب إلى أن‎ od 


Ho gS‏ وهذا الأخير بدوره يعتبر أساسًا تقوم عليه عدة تطبيقات مثل «تمكين المكفوفين من استخدام الكمبيوتر 
عبر قراءة محتويات als‏ وأنظمة «الاستجابة التفاعلية الصوتية IVR‏ ... إلخ. 
-١‏ ومن أمثلة تلك الدراسات الحديثة ما جاء في الورقة البحثية الآتية: 
Rashwan ,M ,.Al-Badrashiny ,M ,.Attia ,M ,.Abdou ,S ,.Rafea ,A ,.A Stochastic Arabic Dia-‏ 
critizer Based on a Hybrid of Factorized and Un-factorized Textual Features ,[EEE Transac-‏ 
tions on Audio ,Speech ,and Language Processing) TASLP (http//:www.SignalProcessingSoci-‏ 
ety.org/Publications/Periodicals/TASLP ,Vol — 19 Issue ;1 pp 166-175 .http//:ieeexplore.ieee.‏ 
org/xpl/freeabs all.jsp?arnumber ,5428861-Jan.2011 .‏ 
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أجزاء/ مستويات المسألة فتكون فئة الحلول الممكنة للمسألة بكاملها عندئذٍ هى تلك 


التي نجت من GIL‏ وبقيت في فضاء الحلول. 
ولإسقاط «التقييد المتعاقب» على مسألة التحليل الصرفي العربي" Op‏ علينا ELI‏ 
الخطوات التالية: 


Jj‏ تضاف أية سابقة ينطبق هجاؤها على Le‏ من هجاء الكلمة fe‏ الدراسة إلى 
فضاء الحلول. ASD)‏ طرح فرضيات»). 

ب. تضاف أية لاحقة حقة ينطبق هجاؤها على عَجُّز(۲) من هجاء الكلمة je‏ الدراسة 
إلى فضاء الحلول. ASI‏ طرح فرضيات»). 

ج. من بين القائمتين اللتين حصلنا cede‏ في الخطوتين السابقتين يتم توليد كل 
الأزواج المرتبة الممكنة (سابقة» لاحقة) ومن نَمَّ يتم دفعُها إلى فضاء الحلول. 
an‏ طرح فرضيات). 

د. يتم استبعادٌ الأزواج المتنافرة من فضاء الحلول. EID)‏ تقييد)». 

ه. لكل زوج Sys‏ متبقٌ في فضاء الحلول من الخطوة السابقة؛ يتم استخلاص 
e‏ الكلمة (الكلمة بدون السابقة is a‏ التعويض بالطبع عن 
Ten pu‏ ا 2 TU‏ إلى QA PUT‏ «آلية طرح 
فرضيات»». 

ASTD ME didi AES 3‏ لي 
الحاسوبية لكل الخذور al aly‏ القاعدة الغوي نامج اليل 
الصرفي عن كل الأزواج TSM‏ على هيئة (نوع الكلمة: جذر» صيغة صرفية) 
التى يكون الحجاء الناتج من صب جذرها في صيغتها الصرفية مطابقًا هجاء 
ا لجذع» A333 s‏ فرضيات التحليل الصرفي للكلمة العربية محل الدراسة إلى فضاء 


-١‏ لزيد من التفاصيل التقنية الدقيقة بهذا ا لخصوص يمكن الاطلاع على الفصل السادس من المرجع رقم ]٠١[‏ فى قائمة 
المراجع نباية هذا الكتاب. 
AE Y‏ الشيء هو مؤخرته أو أسفله أو خاتمته. والجمع أعجاز. 
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الحلول في صورتها القياسية (نوع الكلمة: سابقة» جذر» صيغة صرفية» (GR‏ 
(«آلية طرح فرضيات»). 
ح. وبالطبع تستبعد من فضاء الحلول تلك الجذوع التي لا يمكن تكوينها بصب 


- 


أي جذر في )4 صيغة صرفية. ((آلية تقييد)). 

ط. لكل من التحليلات الصرفية الموجودة في فضاء الحلول بعد الخطوة السابقة 
يجري اختبار عدم التنافر بين السابقة والصيغة الصرفية وكذلك بين الصيغة 
الصرفية وبين اللاحقة» Ax s‏ تبعًا لذلك التحليلات التى تحتوي على أي 
تنافر. ((آلية تقييد)). 

. يتم تركيب كلمةٍ من كل تحليل متبق في فضاء الحل بعد الخطوة السابقة» ثم 
تُطايّق الكلمة الناتجة من التركيب مقابل الكلمة محل الدراسة من حيث الحجاء 
وكذلك من حيث الضبط الصوتي (إن جد أي ضبط صوت في الكلمة MEA‏ 
محل الدراسة)» وتُستبعد التحليلات الصرفية غير المطابقة من فضاء الحلول. 


- 


((آلمة تقسد)). 


(n 


ك. التحليلات المتبقية (الناجية) الآن في فضاء الحلول هي فئة كل التحليلات 
الصرفية الممكنة للكلمة العربية محل الدراسة. (آلية تقييد)». 

وجدير بالملاحظة في كل هذه الخطوات أن الحصول على التحليلات الصرفية للكلمة 

يتم e Ct‏ التركيب الصرفي (وفق ما جرى عرضه في الأقسام السابقة من هذا الفصل) 

ere ee‏ لحر a ae ve e‏ اضرم 

العربية واستبعاد ما لا يستوفي هذه الشروطه وبتكرار هذه العملية إلى أن ghd‏ جسم 

الكلمة محل الدراسة IRE‏ ما يتبقى من هذه الفرضيات BS‏ الحلول الممكنة هذه الكلمة. 


dai dal ue -^‏ إزالته 


ind a ae 43 صر‎ d ue dU 
وجود تحليل صرفي عربي على الإطلاق» وهذا كله يعني على وجه العموم أن تطبيق‎ 


کو 


هذه العملية على أية كلمة عربية ينتج تحليلاتٍ متعددةً وهو ما Ga‏ اصطلاحًا باسم 
«الالتباس .(Morphological Ambiguity) tà „al‏ 

ويعرض الجدول رقم (۳-۲) أدناه مثالا Sede‏ على هذا الالتباس عند إجراء 
عملية التحليل الصرفي العربي حاسوبيًا على الكلمة العربية الخام «بطين)؛ حيث تم 
تظليل كل تحليل SE‏ من التحليلات الصرفية القياسية المتعددة هذه الكلمة بنظل 
رمادي ذي BUS‏ متناسبة مع درجة الشيوع السماعية لهذا التحليل O‏ 

وني غياب iJ‏ تختار واحدًا فقط من بين التحليلات الصرفية المتعددة - وهو 
ما Ge‏ اصطلاحًا باشم al»‏ الالتباس الصرفي» Morphological)‏ 
(Disambiguation‏ - فلا يمكن أن fox‏ هذا التحليل الصرفي العربي آليا ويظل ذا 
قيمه تطبيقية محدودة. 

ويجدر بنا قبل مناقشة كيفية فك الالتباس الصرفي العربي أن نلقي نظرةً على الأسباب 
الرئيسية هذا الالتباس والتي يمكن تلخيصها فيا يلي: 

أ. افتقاد علامات التشكيل/ الضبط الصوتي - إلا e‏ ندر - في الكتابة المعاصرة 
للنص العربي وذلك ارتكانًا على قدرة القارئ العربي المتمرس على استنباط هذه 
العلامات بنفسه مستفيدًا من عدة قرائن سوف نذكرها فيا يلي من نقاط. 
بل إنه من الجدير SUL‏ أن استنتاج علامات التشكيل الصوتي —- cus‏ 
النص العربي الخام هو بحد ذاته هدف للتحليل الحاسوبي المعمّق للغة العربية 
eec‏ فيه التحليل الصرفي العربي الآلي كا أشرنا إلى ذلك في القسم قبل السابق 
من هذا الفصل. وعلى الرغم من أن إضافة التشكيل الصوتي ولو جزئيًا لبعض 
الكلمات قد يفك/ يقلل من الالتباس فيها؛ وذلك مثل «مستعور)» «مقذم»» 
ايقسّم) ... » ob‏ علينا الانتباه في الحالة العامة إلى عدم كفاية إضافة التشكيل 
الصوتي ولو كان Seals‏ لإزالة الالتباس؛ وذلك مثل (قَرَضُوا)ء «قائل)» «يسبر»» 
LED‏ ... فقد يكون المثال الأول فعلاً ماضيًا من مادة الجذر (ف» ر» ض) أو 


-١‏ المحلل الصرفي العربي المستخدّم للحصول على التحليلات الواردة في الجدول المذكور هو ذلك الموصوف في المرجع 
رقم ]110 (وخصوصًا الفصول من خمسة إلى سبعة) من قائمة المراجع نهاية هذا الكتاب. 
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فعلاً ماضيًا معطوفا بالفاء من مادة الجذر c)‏ ض» ي)» كما قد يكون المثال الثاني 
اسم فاعل من مادة الجذر (ق» و» ل) أو من مادة الجذر (ق» ي» JEU Ul (I‏ 
الثالث فقد يكون فعلاً مضارعًا من مادة الجذر (س» ي» ر) أو صيغة مبالغة من 
مادة الجذر (ي» سء ر) LÍ‏ المثال الرابع فقد يكون فعلاً ماضيًا أو اسن Les‏ 
من مادة الجذر (شء 563( 

ب. Gee‏ تشتغل أية آلية للتحليل الصرفي على كل كلمة في النص بشكل ajo je‏ 
الذهن البشري يستفيد في حكمه على أية كلمة من سياق النص حوها؛ فعل 
سبيل المثال نستطيع كقارئين للعربية بكفاءة فك التباس كلمة «بطين» عندما ترد 
في السياقات الثلاث المختلفة الآتية (... يحمل الدم الموجود في البطين الأيمن 
من القلب ...)» و(... الذي يختلط بطين الأرض فيصير ...)» و(... أنه رجل 
طن حو 

. وفي قدراته تلك على فك الالتباس الصرفي يعتمد الذهن البشري على ALLL‏ 
المتزامنة لسياق الكلمة على مستويات عدة من التحليل اللغوي - وخصوصًا 
الدلالة polly‏ د إضافة إل e pads cod poll‏ انظ لا JE‏ أدواتنا ia gall‏ 
والرياضية قاصرة عن محاكاة هذه ALLL‏ اللغوية المتزامنة بكفاءة لحظية. 
وكمثال على ذلك نحلل السياق التالي (... فالكهرباء وقود يسير هذا النوع 
من السيارات.) حيث يستبعد القارئ العربي تفسير ما تحته خط على أنه الصفة 
Co‏ من Bole‏ الجذر (ي» س» O‏ في صيغة المبالغة «فعيل» وذلك OY‏ ما 
يتيحه السياق النحوي من موصوفات محتملة هو «فالكهرباء» أو «وقود» 
وكلاهما بعيد aig oe Wo‏ بصفة CL‏ كا يستبعد القارئ العربي LA‏ 
تفسيرّه على أنه الفعل اللازم Coed‏ من مادة جذر (س» ي» O‏ وذلك OY‏ 
اعتبار «هذا» كفاعل صريح يؤدي إلى اختلال دلالة العبارة وبنائها حيث تفتقر 
الجملة الفعلية التي تقع في محل dae‏ للاسم قبلها إلى متعلق يربطها بموصوفها 
alls -‏ يقال (... وقود Sued‏ به هذا النوع ...) - كما أن اعتبار الفاعل ضميرًا 
مستترًا يعود على «فالكهرباء» أو «الوقود» غير مناسب دلاليًا حيث إن leo Ul‏ 
لا «Cus‏ ويستبعَد كذلك التفسير CAC‏ لأسباب AEE‏ .... ورب لا يتبقى 


eM = 


EN 


6 ex 


وقد تبينت أهمية هذا السياق الخارجى أثناء مناقشة المثال في النقطة ALS‏ 
وريد مق اليا ples‏ العاف dd...) di‏ ريدت iac‏ هذا تدك 
مهام C...‏ فإذا كان القارئ يعرف أن السياق الخارجي للنص يشير إلى بلدنا 
العزيز «الجزائر» (كأن يرد مثلاً في جريدة تصدر في ال جزائرء ... إلخ) وكان 
يعرف أيضًا أن OAD‏ هى ste]‏ مدا آلى تاهب لاستقبال dolce‏ هامة 
فإنه يستطيع تقرير أن ما تحته خط ليس كلمة GALS‏ (التي قد تصف JÉ‏ 
امرأة تتزين زينة حقيقة) lily‏ هي كلمة GI‏ (بافتراض ple‏ القارئ أن 
فعل التزين يمكن أن LZ‏ إلى اسم علم على مدينة كاستخدام مجازي بلاغي 


صرفيا ونحو 


لدى القارئ في Ale‏ المطاف احتمال قوي يحقق صحة الكلام 
Na y‏ أن واحدسورى MALY‏ 
د إقنافة إلى jel Ghee‏ الذي ترد.فية:الكلمة عل التراسة والتعليل» يود 
سياق آخر لا يقل أهمية عنه في فك التباسها؛ آلا وهو «السياق EE‏ النص» 
ونقصد به حقائق العام وتفاعلاته وملابسات الأحداث المعاصرة للكلام ... 
إلخ» ومرة أخرى ومع الأسف فإنه لم يتم إلى OV‏ بناء قاعدة معرفية حاسوبية 
تصف بصورة مكتملة العام المشترك بين عموم البشر”" ناهيك عن القدرة على 
حوسبة كل سياق خارجي خاص بفئة معينة من البشر كالمحامين» أو مهندسي 
الاتصالاتء أو الأدباء» أو عمال coll‏ أو سكان حي معين في بلدةٍ ماء ... إلخ. 


عبر الاستعارة CSM‏ 
| الكلمة نوعها السابقة ٠‏ الجذر الصيغة الصرفية e»‏ | 
de obo = 7 zi‏ 5 
nbn :‏ - 
ose:‏ تسم و VY Yoy ١‏ : 
y;‏ 
s des obo n 3 (5‏ 
ira da 2‏ - ` 
Vaa Yoy . alee de‏ 5 
١-لمزيد‏ من التفاصيل حول p‏ المعالجة الدلالية يرجى الرجوع إلى الباب السادس من هذا الكتاب حول «التحليل الدلالي». 


Y‏ 7 تسمى مثل هذه القاعدة المعرفية «أنطولوجيا (Ontology‏ وني الفصل الخامس «التحليل الدلالي» في هذا الكتاب 
نستعرض هذا المفهوم ونناقش أهم مكوناته وكذلك أهميته لحوسبة التحليل الدلالي. 
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| الكلمة نوعها السابقة الجذر الصيغة الصرفية eu‏ | 

|o qum quem | ل‎ 
ZR cd Rc 
OE ل‎ Er 

8 222 : - j 
| oe [oe | ee] 
ZEE MEN | 

a ۴ a 
0 0 pus 0 ce 2 
0 i pr : eee fh 
|o mee [I| mh 

E m i 7 f 
pow eae 
si a e ELE: 


Y- YU att‏ : مثال على الالتباس الصرفي عند التحليل الصرفي الآلي لكلمة «بطين». 
ومع بروز إشكالية الالتباس على المستوى الصرفي (وعلى باقي مستويات اللغة) 
pls‏ لا فكاك منه بكل تحدياته التى عرضناها Le‏ فقد توجه المشتغلون بالمعالجة 
الحاسوبية Er‏ الحية إلى استعارة وتطويع أساليب التعلم الحاسوبي التي أثبتت 
GAS‏ التعامل مع مسائل صعبة وحيوية في صناعة المعلومات والاتصالات الحديثة 
مثل «معالحة الإشارات» (Signal Processing)‏ و «التعرف على Pattern) (bÑ!‏ 
(Recognition‏ ... إلخ. وبصفة عامة فإن أساليب «التعلم الحاسوبي) Machine))‏ 
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Learning‏ تطبّق كأنسب ما يكون 251d‏ المسائل التى لا تُعْرّف لما أو حيث يتعذر 
الحصول لما على «حلول (CClosed- Form Solutions MaKe Ael st‏ « وتنطلق 
هذه الأساليب - على اختلافها - من مبدأ إمكانية التعلم عبر تكرار التعرض الغزير 
للأمثلة الصحيحة والأمثلة الخاطئة أو عبر تكرار التعرض الغزير للأسئلة وأجوبتها 
حول جزئيات المسألة المطلوب مقاربتها؛ فالطفل مثلاً قد يجيد القراءة السليمة للغة 
العربية قبل أن يتعلم أسس وقواعد اللغة من صرف ونحو ودلالة ... إلخ وذلك عبر 
تقليد الأكبر سنا وعبر محاولات الصواب والخطأ مع تصويب الأخطاء حيث يتحسن 
الأداء مع معاودّة ذلك كله مرارًا وتكرارًا. 

ويرتكز بصفة dole‏ تفعيل تلك الأساليب رياضيًا وحاسوبيًا هذا المبدأ على استقراء 
السياق M VI‏ للكلمة LS Je‏ عن سياقها اللغوي (النحوي-الدلالي) بغية الوصول 
إلى حساب الاحتمال الرياضي لوقوع كل تحليل تمكن للكلمة بين ما يسبقه وما يلحق 
به من كلمات yey‏ ترجيح التحليل صاحب أكبر احتمال رياضي» وتستلزم عملية 
إجراء الحساب هذه تكوين نموذج احتمال رياضي يحاكي كل تتابعات الوحدات 
اللغوية |S‏ تحدث في الواقع الحقيقي لاستخدام اللغة. وفي حين أن المرجع رقم [Y V1‏ 
من قائمة المراجع نهاية هذا الكتاب يدرس باستفاضة أساليب التعلم الحاسوبي المختلفة 
بتفاصيلها الرياضية المعمّقة» فإن المرجع رقم ] * EY‏ من نفس القائمة يستفيض في تطبيق 
بعض هذه GIL‏ على معالجة اللغات AH‏ 

Ol‏ ما كانت الأساليب الرياضية والحاسوبية المختارة لبناء مثل هذا النموذج 
cic YI‏ فلا بد ها من مادة لغوية تملأ وعاءً واسعًا من الأسئلة (الكلمات الخام على 
سبيل المثال) مع أجوبتها (التحليل الصرفي الصحيح للكلمة على سبيل (ee (JUL‏ 
يقتضي التعلم الحاسوي lad s cat AM‏ على عملية تشغيل هذه الأساليب الرياضية على 
المادة اللغوية لبناء النموذج Me VE‏ اسم «التدريب» |S (Training)‏ يطلق على الوعاء 
الواسع الممتلئ بالمادة اللغوية اسم «المورد اللغوي) (Language Resource)‏ وبطبيعة 
الخال فإن النموذج الاحتمالي سوف يحمل الخصائص الإحصائية للمورد اللغوي الذي 
O55‏ منه» والذي عليه بدوره أن fot‏ خصائص الظاهرة اللغوية التي يعبر عنها وهو 
ما يشلمنا إلى اعتبارات وشروط بناء الموارد اللغوية في القسم التالي. l‏ 
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هذه الطبعة إهداء من المركز 
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4- بناء الموارد اللغوية اللازمة لفك الالتباس الصرني 

من أجل نجاح عملية فك الالتباس اللغوي (سواء كان صرفيًا أو غير ذلك) فإن 
النموذج ic YI‏ الرياضي للظاهرة اللغوية محل الدرس EY‏ أن يحمل قدرٌ الإمكان 
Sis‏ الخصائص الإحصائية”" لهذه الظاهرة اللغوية» ومن أجل تحقق ذلك SN‏ أن 
يحمل المورد اللغوي بدوره قدرٌ الإمكان ذاتَ الخصائص الإحصائية للظاهرة اللغوية» 
ومن أجل ذلك يتوجب أن يتوافر فيه الشرطان الآتيان: 


أن تختار المادة الخام (سواء أكانت نصوصًا ol‏ خلاف ذلك) في المورد اللغوي 
بحيث تشكل dye‏ حسنة التمقيل للظاهرة اللغوية: ويعتى ذلك أن glans‏ هذه 
العينة الأبعاد الأربعة لفضاء التنوع اللغوي السالف 55 la‏ في القسم الخامس 
من هذا الفصل (وهي البعد الزمني» والبعد الجغرافي» والبعد الموضوعيء 
والبعد الأسلوبي) بحيث تتناسب أوزان تمثيل كل حيز في هذا الفضاء في تلك 
المادة الخام قَدْرَ الإمكان مع أهميتها في التطبيق الذي Gb Le‏ فيه النموذج 
الاحتمالي الناتج من التدريب على هذا المورد اللغوي. 


. أن CF‏ عملية S‏ المادة اللغوية الخام لإنتاج المورد اللغوي بدقة عالية 


Aiax y‏ بعملية «العنونة» GLE] (Annotation)‏ التحليلات اللغوية المناسبة 
(كالتحليل الصرفي على سبيل (JE‏ بكل وحدة لغوية في المادة الخام لتكوّن 
جميعها المورد اللغوي. وتنبع ضرورة الدقة العالية في هذا المقام من أن المورد 
اللغوي الناتج هو مادة التدريب Ub‏ كانت أساليب التدريب) gU‏ 
النموذج Mice VE‏ الرياضي الذي تعتمد عليه آليات فك الالتباس» OB‏ 
كان المورد رديء الجودة فالنموذج الاحتالي الناتج عنه هو بالتأكيد معيبٌ 


£ 


d 


-١‏ المقصود بالمخصائص الإحصائية للظاهرة اللغوية هو التكرارات النسبية لوحداتها اللغوية في واقع تطبيق هذه 
الظاهرة اللغوية. 
= تشيع أيضًا لفظة e si)‏ لتر حمة المصطلح (Annotation)‏ 
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وبالتبعية يصير Pol‏ آلية فك الالتباس المعتودة عليه رديئاء Ax],‏ هذا Cl‏ 
بدا في الرياضيات الحاسوبية مؤداه أن «معالجة النفايات WEIN‏ لا EB‏ إلا 
النفايات) (Garbage In - Garbage Out)‏ ويعرف بالاختصار .«GIGO»‏ 


ومن النماذج الجيدة على بناء الموارد اللغوية العربية الحديثة ما جاء في الورقة المشار 
إليها برقم [؟؟] فى قائمة المراجع Sle‏ هذا الكتاب والتي تناولت عدة أصناف من 
الموارد اللغوية التي تم إنجازها بالفعل؛ منها النصية ومنها الصوتية ومنها المختلطة. 

ومن الجدير SUL‏ في هذا المقام أن إعداد وعنونة المواد اللغوية الخام = سواء كانت 
نصية أم لاء والتي تسمى اصطلاحًا «مُدَوّنات» eti (Corpora)‏ الموارد اللغوية 
قد صار منذ بداية القرن الحادي والعشرين الميلادي نشاطًا ذا حجم كبير في أبحاث 
وصناعة تطبيقات Lhe‏ اللغات الحية بمختلّف أصنافهاء وقد يتخطى حجم هذا 
النشاط أحيانًا الخمسين في المئة ضمن كافة أنشطة معالجة اللغات الحية من معالحات 
رياضية وتصميم وبناء البرمجيات لتنفيذها ... إلخ» > وهو ما أدركه المجتمع 
العا مي المشتغل بهذا المجال فقام بتخصيص أكبر مؤتمراته للموارد اللغوية وبمختلف 
الوا حت االو برل رطفا دقر اسه 1٥‏ ويُعْقَد بوتيرة منتظمة مرةً كل سنتين 
منذ عام ۱۹۹۸م ويتراوح عدد حضوره في كل من دوراته ما بين الألف والألفين من 
المتخصصين كا يتجاوز عدد مساراته العشرين مسارًا كي تغطي مختلف أنواع وأناط 
الموارد اللغوية -http: / /www.lrec—conf. org‏ 


إعداد المدّوّنات اللغوية وبناء الموارد اللغوية بمختلف أنواعها هو أحد أكبر الأنشطة في 
Jle‏ أبحاث وصناعة تطبيقات معالجة اللغات الحية . وبسبب ضخامة حجم المادة وارتفاع 
دقة العنونة oi lll‏ لكل من هذه الموارد اللغوية» فضلاً عن التنوع الواسع لأصناف هذه 
co JL‏ إضافة إلى قلة عدد الموارد اللغوية التي جرى إنجازها بالفعل في حقل اللغة العربية» 
فإن هذا النشاط يستدعي أن تنخرط فيه أعداد كبيرة LS‏ لكان 
a‏ لل ee‏ تر ررس 
تأليف هذا الكتاب. 


- أدوات وبرمجيات ومعايير 
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عدو c eg‏ را وا ار رد للخو على Rc‏ عا XU‏ 
تنظيمي يضبط اطَّراد واتساق عنونة المدوّنات اللغوية (مثل التحليل الصرفي لكلمات 
المدونة) من مُعَنونٍ CAT‏ ويدعم في الوقت نفسه كفاءة العنونة ودقتهاء ويتيح كذلك 
مراجعتها ومراقية نسبة الإنجاز ... وغير ذلك من وظائف. Jb JS Chal ey‏ 
وک ie Je Vials‏ وا (ape sob LZ 2 leri E‏ 
Annotation Tool)‏ . 


ويعرض الشكل رقم Y)‏ 7 0( أدناه لقطة أثناء تشغيل إحدى هذه الأدوات التي SE‏ 
اللغويين من إدارة وعنونة المدونات النصية العربية من النواحي الصوتية (الفونولوجية) 
والصرفية والدلالية وذلك بأسلوب تفاعلي عبر واجهة استخدام رسومية مفصلة تتيح 
ا 


7 1 


i ^ df." " ا اال ضام 5 22 ارد‎ qf p vene 
ولور ر حول:‎ ar m 1 le ادل | = = رات ب الشعوب‎ 3 A كب‎ | T 72 
ean cp eS Mp j Saleya 


dua ^ al TA GATES uo - 


aM C Miah متخي‎ "y Sa) تَعَالى‎ 
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الشّكل o Y‏ لقطة من أداة عنونة النص العربي صوتيًا وصرفيًا real (ss‏ 


E e y aes M 33 gall ol gal التغوية‎ 3 lll paar inb bed oe dy 

مُعتوِدةٍ في وظائفها على لغة محتوى هذه الموارد (مثل بعض أنواع الموارد اللغوية للكلام 
المنطوق) فتكون Us‏ لذلك مثل هذه الأدواتٍ قابلة لإعادة الاستخدام في أغلب 
الأحيان بين لغة وأخرىء OB‏ طبيعة بعض الموارد اللغوية الأخرى (وخصوصًا تلك 
النصية» أو تلك التي يشكل النص ركتا أساسيًا فيها) تحتم إنشاء أدوات عنونة جديدة 
تراعي خصوصيات لغة محتوى هذه الموارد» وتقع أدوات عنونة المدَوّنات النصية العربية 
بمختلف أنواعها ضمن الفئة الثانية» وبنظرة عامة على الحالة الراهنة للأدوات العربية 
من هذه الففئة الثانية تتضح لنا المساحات التالية التي تتسع لإسهامات اللغويين العرب: 


-١‏ يمكن الرجوع إلى تفاصيل هذه الأداة التفاعلية في الورقة المشار إليها برقم EVU‏ فى قائمة المراجع نهاية هذا الكتاب. 
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* بالقياس إلى الكثير الذي يُرتقب ode]‏ والقيام على تحديثه من مختلف الموارد اللغوية 
العربية النصية (أو تلك التي يُعتبر النص العربي ركنًا فيها) I‏ ما جرى بناؤه من أدوات 
00 
المطلوبة لبناء الأدوات CT‏ هناك كذلك حاجة إلى إسهام من ناحية اللغويين 
العرب وخصوصًا في| يتعلق بتصميم واختبار واجهات الاستخدام وتفاعلييتها. 

* وحتى بالنظر إلى أدوات العنونة العربية التي تم بناؤها بالفعل فإن استخدامها لا يزال 
غير شائع إلا على نطاق محدود» ومرجع ذلك في كثير من الأحيان هو أن ملكيتها تعود 
إلى الشركات التى ley gb‏ ولذلك فإن هناك حاجة للعمل على التوعية بالآدوات الجيدة 
s Sy XUI Ca JT oy‏ ا ا ce Maas col‏ قات Biel‏ 
مبتكرة من تعويض الشركات لإقناعها بإتاحة أفضل ما Gy gh‏ من أدوات العنونة 
العربية للاستخدام الحر أو مقابل رسوم زهيدة» وهو ما يحتاج إلى جمعيات/ تنسيقيات/ 
تكتلات من المشتغلين بأبحاث وصناعة تطبيقات المعالحة الحاسوبية للغة العربية بمن 
فيهم اللغويون. 

* إجراء رصد دوري شامل لكل ما cpt‏ من أدوات العنونة العربية مع نقد وتقييم ell‏ 
كل منها ومن oF‏ ترشيح الأفضل من بينها لإنجاز كل نوع من الموارد اللغوية العربية» 
فضلاً عن إجراء رصد أوسع لأدوات العنونة غير العربية ذات البرمجيات مفتوحة المصدر 
ما قد يمكن تطويعها بجهد معقول لإنتاج الموارد اللغوية العربية» ومثل هذه الأرصاد 
والتقيبمات تحتاج أيضًا لحهود منظمة من جمعيات/ تنسيقيات/ تكتلات من المشتغلين 
بأبحاث وصناعة تطبيقات LL‏ الحاسوبية للغة العربية بمن فيهم اللغويون. 

أما بالنظر إلى الوضع الراهن لبرمجيات التحليل الصرفي العربي sus‏ الأول المختص 

باستخلاص كل التحليلات الصرفية AY EKN‏ كلمة عربية والثاني المختص بفك 

الالتباس الصرفي» فإن تاريخ العمل على هذه المسألة من بحث وتطوير والذي يمتد 
منذ سبعينات القرن العشرين الميلادي قد أثمر عددًا كافيًا من حزم OLE SI‏ الناضجة 
بمستوى تطبيقي صناعي وذلك مع نهاية تسعينات القرن العشرين الميلادي» حيث 
وصل هامش الخطأ في الشق الأول إلى ما دون الاثنين في الألف كما وصل هامش الخطأ 
في الشق الثاني إلى ما دون الخمسة في المئة بعد التدريب على ذخيرة صر فية عربية متوازنة 


ددم اله 


التغطية للفضاء اللغوي ذات حجم ثلاثة ملايين كلمة V‏ وذات جودة U ge‏ رفيعة 
لا يزيد هامش الخطأ فيها عن خمسة في الألف» وفي حدود هوامش Las‏ محدودة كهذه 
أمكن بناء تطبيقات صناعية ترتكز على التحليل الصرفي العربي الآلي وذات أداء مقبول. 
ويجدر بنا الإشارة في هذا المقام قبل أن نختتم هذا الفصل إلى بعض الأعمال 
التى اشتهرت وشاعت بين الباحثين في جال المعالجة الآلية للغة العربية؛ 
Lya‏ المحلل الصرفي العربي الذي اشتهر باسم مصممه الأسامي C SU Gd‏ 
Tim Buckwalter (http://www.qamus.org/morphology.htm)‏ الذي يمكن 
الحصول عليه من خلال »1.252 «Linguistic Data Consortium (LDC)‏ في 
جامعة (UL‏ بالولايات المتحدة الأمريكية أثناء عمله فيها وذلك عر http://‏ 
www.ldc.upenn.edu/catalog/catalogEntry.j sp?catalold=LDC2002L49‏ 
والنسخة الشائعة منه هي الإصدارة ١,١‏ التي ظهرت في نوفمبر عام 7١٠7م‏ ويمكن 
الحصول عليها بالمجان للمشتركين في الجمعية أو بمقابل رمزي لغير المشتركين فيها. 
كا أن هناك حزمة الأدوات البرمجية المعروفة باسم «مَدَى MADAH) (lS shy‏ 
ly (TOKAN‏ تعمل على معالجة النص العربي الخام لاستخراج أنسب المعلومات 
الصرفية والمعجمية والصوتية والأنواع الكلامية لكل كلمة بمراعاة السياق المحيط بهاء 
وقد تم تطوير هذه الحزمة في جامعة hh Si‏ بالولايات المتحدة الأمريكية ويمكن 
الاطلاع على تفاصيلها في الورقة المشار إليها برقم Y]‏ فى قائمة المراجع نهاية هذا 


-١‏ وقد ينخفض هامش الخطأ في فك الالتباس الصرفي الآلي إلى ما دون الثلاثة في المئة مع ذخيرة صرفية بنفس الحجم 
ولكنها مركزة في حيز ضيق من الفضاء اللغوي («النصوص القانونية المعاصرة في مصر» على سبيل OBL‏ كا يعتقد 
أنه دون الاستعانة بتحليلات صحيحة من طبقات لغوية أعلى (كالدلالة والنحو على سبيل المثال) يظل هناك حد أدنى 
هذا النوع من هوامش الخطأ لا يقل عن الثلاثة في المئة مهما زاد حجم الذخيرة اللغوية الصرفية التي جرى تدريب آلية 
فك الالتباس عليها. 
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الكتاب. 
كما تعالج حزمة الأدوات البرمجية المعروفة باسم KAMIRA Geh‏ كلمات النص 

العربي لتعيين لواصقها وتحديد أنواعها الكلامية وتقسيم النص إلى أقصر عبارات غير 

متداخلة في شجرة تحليله الإعرابي» ويمكن الاطلاع على تفاصيلها في الورقة المشار إليها 

برقم GL VAT‏ قائمة المراجع نهاية هذا الكتاب. 
ومع عدم الحاجة للمزيد من الأبحاث في مسألة التحليل الصرفي العربي الآلي» فإنه 

لاتزال هناك ضرورة للعمل من أجل تحقيق الأهداف التالية: 

* الاتفاق على معيار موحد SEZs SIEM‏ برمجيات التحليل U d pall‏ يسمح 
بتعظيم فرص إعادة استخدامها في التطبيقات الصناعية» أو Geog‏ في آليات أوسع 
للمعالجة الحاسوبية لِلغة العربية. 

* الاتفاق على معيار موحد وعلى عينة اختبار موحدة لأداء برمجيات التحليل الصرفي 
العربي ما يْمَكُن من المقارنة العادلة AGS‏ 

* رصد كل ما يمكن الوصول إليه من برمجيات التحليل الصرني العربي - وخصوصًا تلك 
المتاحة بالفعل للاستخدام الحر - فضلا عن اقتراح آناط مبتكرة من تعويض الشركات 
لإقناعها بإتاحة أفضل ما طورته من المحللات الصرفية العربية الآلية للاستخدام الجر 
- أو مقابل رسوم زهيدة - بل وحتى طرحها كبرمجيات مفتوحة المصدر. 

* كل ما سبق من uel‏ يحتاج أيضًا مهود منظّمة من جمعيات/ تنسيقيات/ تكتلات من 
المشتغلين بأبحاث وصناعة تطبيقات المعالجة الحاسوبية للغة العربية بمن فيهم اللغويون. 


ببليوجرافيا مرجعيّة 

Yb تحقيق: عبدالسّلام هارون»‎ rat مُقاييس‎ Gel oem ابن فارس (أبو‎ .١ 
MI 

Y‏ ابو facial SP oes‏ هال Gnd‏ لبان «el Jio «ca E‏ روت 

PAAA Me oU مَكْتَبة‎ LW العرَبيّة‎ se مُعْجَمُ‎ COGI _الدّخداح‎ ov 


VARY الإسْكَنْدريّة‎ Anell دار المغرفة‎ c I التطبيق‎ GAS) الرّاجحيّ‎ .4 
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0 رضا (أحمد): مُعْجَم من PAATE yf BANE LS AT RU‏ 
EA‏ الزییدی EU: (85 AE)‏ العروس مِنْ pni‏ القاموس» Rab‏ وَزَارة الإ علام 
.V‏ العاني (سَلمان حَسَن): فونولوجيا العربيّة» - ترجمة ياير الملّاح» دار CSM gall‏ 
بجدّة - ASL‏ العربية eN AAY ds eI‏ 

Spee للق أن الك‎ abl. elena SK 
بعالمو‎ p DD Mt بد المتاح (إبراهيم‎ 
eV AAY الإسلاميّق‎ 


ate niae 4‏ عبد الخالق): call‏ في تضريني SLE‏ دارٌ الحديث. 


s cou .٠‏ إبْراهِيمَ إِسْحاقٌ GI‏ إبراهيم): ديوان الأدب» تحقيق: GI‏ مختار 


-pVAve عمر»‎ 
LDL دار اريخ‎ a Fall JUSU Z3 72 SVN J Zh COLL) قياض‎ .١ 
MIT 
f 


PAIAO Y eha I SAL بالقاهرة»‎ endi s E 
الألف‎ Gis vb OUS pean | مِن‎ e ا بالقاهرة» ما‎ FU REM 
Yrs الجيم‎ ae , 7 والثاء‎ oI Bie الباء ۱۹۸۱ء‎ aye ARE 
حرف الذال‎ CY حرف الدال‎ Ved الخاء‎ oe Yee Sl ax 

pV Yo حرف الرّاء‎ tA 
برا د م‎ es S aod bull 1522 i tale £u BU م‎ E 
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الفصل الرّابع 
التُحليل التّركيبيَ 


-- 


د. سامح الأنصاري 


-Y‏ علاقة منظومة النحو بمنظومتي الصرف والمعجم. 

۳- مدخل إلى تركيب الجملة في علم اللغة. 

- مدخل إلى معالجة تركيب الجملة آليا. 

-o‏ اتجاهات بناء المحللات النحوية. 

5- دقة المحللات النحوية. 

۷- أمثلة للمحللات النحوية. 

-A‏ بعض النقاط البحثية UU‏ من أجل دعم خطة طريق ALLL‏ التركيب في اللغة 
العربية. 


Ao 


هذه الطبعة إهداء من SAM‏ 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


Avie 


-١‏ تقديم 


إن تناول قضية التحليل النحوي والمعالجة الآلية لتركيب الجملة في اللغة العربية 
موضوع متشعب الأبعاد والجوانب نتيجة لخصوصية طبيعة اللغة العربية» حيث إن 
منظومة النحو تندرج فيها العديد من النظريات النحوية القديمة والحديثة» بالإضافة 
إلى ارتباطها ارتباطا وثيقا بمنظومتي الصرف والمعجم» ولا مناص من مناقشة التفاعل 
بينهم؛ التفاعل الذي يصل إلى حد الاندماج الكامل. 

وتعتبر عملية التحليل النحوي DY‏ من ركائز ALE‏ الآلية SLU‏ الطبيعية» حيث 
يجري فيها تحديد بنية الجملة من حيث هيكلية مكوناتها ووظائف عناصرهاء وإيجاد 
قالبها النحوي Beel‏ على القواعد النحوية الأساسية من حيث تقسيم الجملة وتحديد 
مكوناتها وتقسيم كلماتها لإيجاد العلاقات النحوية [eb‏ بينها. ويعد المحلل النحوي JII‏ 
مقومًا أساسيًا لا غنى عنه» حيث تعتمد عليه العديد من تطبيقات معالحة اللغة مثل 
التطبيقات الخاصة بتحليل مضمون النصوص وفهمها OT‏ وعمليات الاستخلاص 
والتلخيص والفهرسة الآلية» ونظم الترحمة الآلية» وتطبيقات اكتشاف الأخطاء 
المجائية والنحوية OT‏ 


وقبل التعرض لآليات التحليل النحوي» لا بد من النظر - بشكل عام ودون التقيد 
باتجاه معين - إلى مفهوم القواعد النحوية وكيفية التعبير عنها وتمثيلها وآليات تحليل 
مكوناتهاء فنحو اللغة كان أحد موضوعات البحث منذ وقت طويل في أبحاث علوم 
اللغة والآداب. Bis‏ لطبيعة النحو التي تميل إلى التجريد والاختزال» فقد أصبح 
النحو - كا ذكر الذكتور نبيل علي - «خط الالتقاء بين اللسانيات والرياضيات Je)‏ « 
4. ومؤخرًا قدم SLE‏ علوم الحاسب رؤية جديدة للتمثيل النحوي؛ وهي أن 
التركيب النحوي يمكن تعريفه على أنه نتاج عدد من العمليات الحسابية والتي يمكن 
من Ul‏ صياغة قواعد النحو في صورة قواعد رياضية» يمكن من خلاها توليد عدد 
اجات X AUI ASL oye‏ و La ue‏ 

فيهدف هذا الفصل إلى تقديم بعض المفاهيم الأساسية المتعلقة بتركيب الجملة 
لترسيخ مفهوم التحليل النحوي» وتوضيح أهدافه. فسيسعى هذا الفصل أيضًا إلى 
توضيح مفهوم القواعد والقدرة التوليدية للقواعد وقياسها وإلقاء الضوء على الفارق 


cy E 
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بين بعض الاتجاهات المختلفة للتحليل النحوي» واستعراض التحديات التي تواجهه 
في اللغة العربية بشكل خاص. ثم يتم رصد بعض المحاولات السابقة لبناء المحللات 
النحوية الآلية. ويلي ذلك عرض عام لتقديم المحلل النحوي التفاعلي Interactive)‏ 
445(Analyzer -IAN‏ عمله. وينتهى هذا الفصل بالتعرض للعديد من النقاط 
REX‏ أجل ون fog yall ARN GS ALLL Gu ye Mast‏ 


-Y‏ علاقة منظومة النحو بمنظومتي الصرف والمعجم 

تعتبر اللغة العربية من أعقد اللغات في عائلتها ومن أغناها Eyre‏ وصرفا ومعجًا 
ونحوًا. ey‏ لا شك فيه أن النظر إلى طبيعة منظومة النحو العربي يستدعي التطرق إلى 
طبيعة منظومة الصرف. |3 أن العلاقة العضوية بين الصرف "T‏ 
نفسها على كل من الساحة اللغوية الوصفية وساحة المعالجة الآلية للغة على حل سواء. 
وقد تصل عملية التفاعل بين المنظومتين إلى حد الاندماج الكامل إلى الدرجة التي 
يصعب فيها تحديد أين تلتقيان وأين تفترقان. فعلاقة النحو بالصرف نقطة تحول كبيرة 
في النظرية النحوية الحديثة» فقد قام تشومسكي”' بإدراج «الصرف بأكمله في منظومة 
النحو في نظريته القياسية؛ حيث نظر تشومسكي إلى عمليات التكوين الصرفي للكلمات 
jud collec (gene‏ تحر fab CAAA cle)‏ ليست جرد eats‏ للكليات: 
بل هي هيكلية تتعدد مستوياتها وتتداخل. ونعني بذلك مثلاً أنه من غير الممكن تصور 
إمكانية تحديد اللواحق الصرفية دون معرفة الموقع الإعرابي للكلمة فعلى سبيل المثال لا 
يمكن معرفة أن اللاحقة الصرفية المسئولة عن تعيين الجمع المذكر لكلمة) معلم) هي 
el Co‏ لين) دون النظر إلى الموقع الإعرابي للكلمة داخل الجملة كا في QD CV)‏ 


حضر المعلم(ون) إلى الاجتماع. )01 
كافاً pall‏ المعلم(ين) القدامى. (Y)‏ 


ويمكن أيضًا أن يكون للصيغة الصرفية الواحدة أكثر من وظيفة نحوية. فإذا 
نظرنا إلى اللاحقة الصرفية (HL)‏ الملحقة بالفعل (كنت) فقد يشعر القارئ بالغموض 


-١‏ درس نعوم تشومسكي في مجالات متعددة وهي SELL VLE‏ والرياضيات والفلسفة وهو مؤسس النظرية 
التوليدية التحويلية. 


-YYA- 


(۳) أعمل على الورقة البحثية أمس.‎ (COS 
(£) تعمل على الورقة البحثية أمس.‎ (cs 
(0) تعملين على الورقة البحثية أمس.‎ (CIS 


فيصعب تحديد نوع التاء الملحقة JS‏ فعل - هل هي تاء الفاعل للمتكلم (Gas)‏ 
كما في Q‏ آم eb‏ الفاعل للمخاطب المذكر (كنت) كما في el CE)‏ تاء الفاعل للمخاطب 
المؤنث (eS)‏ كما في )0( - دون معرفة الفاعل في البنية التركيبية لكل dle‏ وعلى ذلك 
فإنه ليس من المتصور أن تتم دراسة التركيب النحوي للجملة بمعزل عن التركيب 
الصرفي للكلمات. 

كا أن علاقة النحو بالمعجم Be‏ محورية في منظومة اللغة لما يزودنا به من أبنية 
الأسماء والأفعال وصيغ الاشتقاق. فلم يعد المعجم Sine CLS‏ بل هو مصدر لإمداد 
النحو بالمفردات التي تغذي المنظومة النحوية ولتحديد أنواع هذه المفردات والفئات 
التي تنتمي إليها. فعلى سبيل المثال جملة (حضر الطالب متآخرًا إلى المدرسة) نجد أنه لا 
يمكن التطرق لتحليل الجملة ووصف تركيبها دون تحديد الفئات التي تنتمي إليها كل 
كلمة وتعيين سماتها الصرفية. وهنا GU‏ دور المعجم المسئول عن هذه الوظيفة ليمدنا بمثل 
هذه المعلومات: حضر: فعل )(17) «(Verb‏ ال: أداة تعريف «(Determiner(DET))‏ 
طالب: اسم (Noun (N))‏ متآخرًا: حال ((Adverb (ADV)‏ إلى: حرف ) 
«(Preposition(P)‏ مدرسة : اسم (N)‏ ويجب أن ننوه أن علاقة النحو العربي بالمعجم 
تتم - في معظمها - من خلال الصرف وذلك نظرًا للثراء الاشتقاقي الشديد للصرف 
العربي('. والخلاصة أن السمات الصرفية النحوية هي إحدى US JE‏ الأساسية التي لا 
l EE E A‏ 


١-«الحملة‏ العربية ما هي إلا نتاج التفاعل بين إسقاطات كلاتها النحوية والمعجمية). 
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*- مدخل إلى ت ركيب الجملة في علم اللغة 

تتكون اللغة من مجموعة من الحروف التي تتكون منها الكلمات والتي بدورها 
مسئولة عن تكوين الجمل» وتختلف كل لغة عن الأخرى في العديد من الخصائص 
اللغوية ومن أهم هذه الخصائص ترتيب الكلمات. فلكل لغة تركيب نحوي أي توزيع 
منتظم غير عشوائي للعناصر المكونة لكل tle‏ ويتم ذلك التوزيع من خلال مجموعة 
من القواعد؛ مسئولة عن تحديد هيكل الحملة وترتيب عناصرها ine gig‏ وظيفة كل 
عنصر. فعلى سبيل المثال في اللغة الانجليزية Gh‏ الفاعل قبل الفعل Gh lew‏ المفعول 
به بعد الفعل ويسمى هذا التركيب (Subject -Verb -Object (SVO)‏ ولكن 
الوضع ليس كذلك في كثير من اللغات الأخرى فقد يأتي الفاعل والمفعول قبل الفعل. 
لذلك فإن أحد الوظائف المامة للقواعد هى توصيف LAS‏ التعبير عن تركيب الجمل. 
راف رسکی e PAM Ael B‏ عكرق من ثلاث مكونات أساسة وی 
youl tel yal‏ & و قرم ذا SLI‏ 0 بعحديد yall‏ اعد ال ي الحو fl‏ كب ال 
تركيبا سليم| في اللغة. والقواعد الدلالية والتى تحدد كيفية تفسير معنى الجمل. والقواعد 
m i al‏ وهو الك 2 تجرد UL‏ الوق الاك لتاب G cll‏ يمن ALM‏ رلا 
بد هنا أن ننوه إلى أن فقدان المكون المورفولوجي من ضمن تلك المكونات يرجع إلى أن 
تشومسكي يتبنى الفكر الذي يزكي كون المكون المورفولوجي يتداخل ضمن المكونين 
النحوي والفونولوجي )1993 .(Katamba,‏ 

وبالنظر إلى مُكون القواعد النحوية- قضيتنا الأساسية في هذا الفصل- فإن هذا 
المكون يجب أن يؤدي وظيفتين جوهريتين وهما؛ أولا: القدرة على التوليد والتحليل 
الصحيحين لكل الجمل الصحيحة فقطء ثانيا: تعيين البنية النحوية المناسبة للجمل 
المعنية بالتحليل مع الأخذ في الاعتبار الملكة اللغوية O7‏ لابن اللغة وإدراكه للعلاقات 
النحوية بين OILS‏ في هيكل الجملة .وقبل الخوض في تفاصيل هاتين الوظيفتين لا 
E‏ من إلقاء الضوء على مفهوم (التركيب النحوي) للجملة وكيفية تمثيل هذا التركيب 


-١‏ كلمة قواعد تعني وصف اللغة من حيث هي واقع قائم بذاته وصفا موضوعيا وبإمكانها توليد جمل اللغة أي وصف 
جمل اللغة بصورة بينة وجلية فمع نشوء OULU‏ وتطورها لم تعد كلمة قواعد تعني القوانين التي يجب اتباعها 
؟- الملكة اللغوية: هي جزء من كفاية الإنسان» أي جزء من معرفته الضمنية بقواعد اللغة. 


Ape 


والقواعد المنظمة هذا التمثيل. ويعد التمثيل الهرمي من أنجح طرق التمثيل التركيبي 
للجمل الطبيعية وذلك لأنها SLE‏ الملكة اللغوية لابن اللغة الذي لديه معرفة بديهية 
رقي امل اق ele tee)‏ عر ايف و از ered se‏ 
de get‏ معينة من الأصوات يمكن أن تكون كلمة صحيحة قائمة بذاتها منفصلة عن 
تتابع CAT‏ ويستطيع ابن اللغة أن يدرك أن تتابع الكلمات يمكن أن يشكل مكون أو 
مركب ST‏ وهو الوحدة المكونة للجملة؛ فعلى سبيل JE‏ يمكن تمثيل تيار أصوات 
الجملة في CO‏ بدون مسافات. وهنا نجد أن أي ابن للغة العربية لديه ملكة لغوية تجعله 
قادرا على تمييز وتقسيم تلك التتابعات الصوتية الموجودة في O‏ إلى تلك الموجودة في 
(OO‏ بشکل غير واع: 

a) الطالبحضرمتأخرا‎ 

الطالب حضر متأخرا إلى المدرسة(١). (V)‏ 

ee E 
الرابط التركيبي بين الوحدات» فيستطيع أن يتعرف على العلاقة الوثيقة بين‎ OU تمتد‎ 
وامدرسة) حيث ترتبط‎ (JD «ال» و «طالب»؛ وهي من نفس نوع العلاقة التي تربط بين‎ 
.)١-5( هو مبين في الشكل‎ CS UD ب «مدرسة» وليس بالوحدة التي تسبقها‎ D 


ال طالب حضر متأخرا إلى ال مدرسة 


١-٤ JS‏ : بيان الرابط التركيبي بين الكلمات. 


Jaks‏ يعرف ابن اللغة بشكل غير واع أن «المدرسة» مرتبطة ب (إلى» لتمثا وحدة 
أكبر كما هي ممثلة في الشكل )8 (Y=‏ 


ال Ob‏ حضر متأخرا إلى ال مدرسة 


الشّكل 4 Y‏ الرابط بين «المدرسة» و MSD‏ 


١‏ - وفقا AAE lS Lal‏ أن ed‏ الفعل على الاسم في هذا الط pS I‏ . ومع هذا يجوز تقديم الاسم 
على الفعل» »كا في قوِهِ تعالى إوالله Slan‏ مِنَ التاس) [المائدة/ a as. [wv‏ التَّمثِبلَ ie‏ النّمط لتيسير 
فهم القاعدة على اللّغات الإنسانيّة Ue‏ حيتُ يشيع تقديمٌ الاسم على الفعل. 


-١51- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


وتمتد هذه القدرة لتربط (a>)‏ و «متأخرا» و «إلى المدرسة» كوحدة واحدة BIS‏ 


(Y= £) الشكل‎ 


AN 


ال طالب حضر متأخرا إلى ال مدرسة 


f Je»‏ -": ربط احضر) و«متأخرا» Lg‏ المدرسة» كوحدة واحدة. 
وأخيرًا تتابع الكلمات «الطالب حضر متأخرا إلى المدرسة» يمثل وحدة واحدة قائمة 
eli‏ ىا هي ممثلة في الشكل (5-5) والذي هو عبارة عن تمثيل تخطيطي لما يدور في 
عقل ابن اللغة عن العلاقات النحوية بين سلسلة الكلمات المتتابعة ويبرز قدرة ابن اللغة 
على تحديد الوحدات التى تتكون منها الحملة في AV)‏ 


ال طالب “yee‏ متأخرا إلى ال مدرسة 


الشّكل 4 -: تمثيل تخطيطي للوحدات التي تتكون منها الجملة V)‏ 

كذلك تتد قدرة ابن اللغة ليستطيع التعرف على الوحدات التي ها نفس الفئة وذلك 
من خلال ملكته اللغوية الذي يمتلكها؛ فعلى سبيل المثال فإنه يستطيع أن يدرك bet‏ 
أن «طالب» و «مدرسة» وحدتان تنتميان لنفس الفئة والتى تختلف تماما عن فئة الكلمة 
حضر» وذلك OY‏ كلا من «طالب» و «مدرسة» اسم؛ ولكن «حضر» فعل. ويستطيع 
أيضا ابن اللغة أن يدرك أن «متأخرا» ها فئة ختلفة وهى حال والتى تختلف عن فئة (AP)‏ 
وهى حرف وكذلك «ال» التى تسبق «طالب» هى نفسها تلك التى تسبق «مدرسة» 
رطا عله tell‏ يق دوك ف هله الات اتات الجا l‏ 

ويمكن كذلك لابن اللغة أن يدرك فئة الوحدات الأكبر ويميزها عن غيرها من 
الوحدات داخل الجملة؛ فهو يستطيع -على سبيل المثال - أن يدرك أن «الطالب» 
و«المدرسة» وحدتان هما نفس الفئة وهى مركب اسمى «(Noun phrase (NP))‏ 
gla y‏ عليه ذلك ON‏ هة راه Cae ali priae Joly peel)‏ کل Ge US yu‏ 


-\ey- 


وسمي > Ol phrase (PP) e‏ كذلك da OY‏ رأسه (حرف)؛ Oly‏ 
«حضر متأخرا إلى المدرسة» «(Verbal phrase (VP)) Cle e Js‏ 5 وسمي كذلك 
OY‏ فئة رأسه (فعل)» وأخيراء ol‏ التتابع «الطالب حضر متأخرا إلى المدرسة» SS‏ 
الوحدة الأكبر التى يطلق عليها (الجملة) «(Sentence (S))‏ وتعرف هذه الفئات 

.(Phrasal Categdries) بالفئات العبارية‎ 


وهذا الفكر يطابق ما عرفه اللغويون بالوسم العباري (Phrase Marker)‏ الذي 
يعرف اختصارًا ب (P-marker)‏ وهو يمثل الهيكل التركيبى للجملة في شكل تتابع 
هرمي من الكلمات هذه الكلمات تشكل مركب (Phrase)‏ وتتابع المركبات يكون جملة. 
ويتم توصيف هذا اليكل التركيبي في شكل تمثيل شجري» ومثال على ذلك ila‏ (حضر 
الطالب متأخرا إلى المدرسة): يتم أولا تعيين الفئة التي تنتمي إليها كل كلمة في الجملة 
وذلك يتم من خلال المعجم. ف «الطالب» تتكون من أداة التعريف «ال» والاسم 
«طالب» والفعل «حضر» والحال «متأخرا» «1p Al,‏ أما PERCENT‏ 
أداة التعريف «ال» والاسم «مدرسة» كا في الشكل )£ (o7‏ 


N DET P ADV V N DET 
ال طالب حضر متأخرا إلى ال مدرسة‎ 


الشكل £ -5: فئات الكلمات التى تتكون منها الجملة (۷). 
ويتم بعد ذلك جمع الكلمات التي تشكل مركبات» فنجد أن أداة التعريف (JI‏ 
تكون مع الاسم gh‏ مركبًا اسميًا وأداة التعريف الأخرى (QD‏ تكون مع الاسم 
US yo Gs ydo‏ اسميا كما في الشكل (5-5). 


NP NP 


N DET P ADV V N DET 
إلى ال مدرسة‎ wb ال طالب حضر‎ 


الشّكل 5-4: ربط الكلمات التي تشكل مركب اسمي. 


a) Oe 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


وأن المركب الاسمي «المدرسة» يكون مع الحرف (PP) G > CS po Jp‏ كما في 


.)۷-٤( الشكل‎ 
PP 
N DET P ADV V N DET 
إلى ال مدرسة‎ j£ v ال طالب‎ 


الشّكل :۷-٤‏ تكوين الم ركب الحرفي «إلى المدرسة». 


وأن الفعل «حضر» يكون مع JH‏ «متأخرًا» والمركب الحرفي «إلى المدرسة» المركب 


الفعلي (VP)‏ كما في الشكل .)۸-٤(‏ 


VP 
PP 
DET P ADV V N DET 
إلى ال‎ wb c ال طالب‎ 


الشّكل :۸-٤‏ تكوين المركب الفعلى «حضر متأخر إلى المدرسة». 


وأخيرًا تتكون الجملة (5) كا في الشكل (A-E)‏ من تتابع المركب الاسمي «الطالب» 


dow All «حضر متأخرًا إلى‎ (VP) والمركب الفعلى‎ (NP) 


NP P 


ADV 


DET y 
JI 


الشّكل £ -3: الهيكل التركيبي النهائي للجملة في (V)‏ 


-١55- 


وبشكل ple‏ يستخدم اللغويون التمثيل الشجري للتعبير عن JSA‏ التركيبي 
للجملة بشكل مفصل. حيث يتم التفريق بين نوعين من الوحدات داخل التمثيل 
الشجري: النوع الأول يسمى بالوحدات النهائية وهي الكلمات في ble‏ الشجرة 
التحليلية التي لا يمكن تحليلها إلى وحدات أقل على مستوى التركيب مثل (حضر - إلى 
| مدرسة ... إلخ) أما النوع الثاني الوحدات غير النهائية وتشمل كل الوحدات داخل 
التركيب التي لم يصل فيها التحليل إلى الكلمة المفردة الموجودة داخل المعجم مثل — S‏ 


.(...... VP-NP-N-V- P 
من الأنظمة الأخرى المتبعة في تمثيل التحليل التركيبي للجمل في اللغات الطبيعية‎ 
يمكن تمثيلها ىا في‎ (V) استخدام الأقواس للتعبير عن هيكل الجملة. فالجملة في‎ 

:)٠١-5( الشكل‎ 


slvelpplypl nl] [إلى م[الجوم‎ abv ly >] wol [[الجوح [طالب]‎ 


الشّكل ٠١-4‏ : تمثيل التحليل التركيبي للجملة (V)‏ باستخدام الأقواس 
0 إلا آن اللغويون يفضلون تمثيل SUI‏ النحوي for‏ بشكل غير تفصيلٍ وهو ما 
يعرف باسم التمثيل الجزئي للتركيب النحوي والذي يتم فيه تمثيل الوحدات الرئيسية 
التى تشكل الجملة دون النظر إلى التركيب الداخلى لتلك الوحدات كما في الشكل )£ - 
١‏ والذي استخدم المثلث لتمثيل الوحدات التي تتكون من تركيب معقد والتي ل يتم 
تمثيلهاء وفي الجملة (A)‏ اتبعت طريقة «استخدام الأقواس» لكن دون تفاصيل وسوف 
نتناول بشكل مفصل التمثيل الحزئى في الحزء الخاص ب «دقة المحللات». 


VP NP 


QUE Yee. EOR 


الطالب حضر متأخرا إلى المدرسة 


الشكل :١١-4‏ التمثيل الجزئي للتركيب النحوي للجملة V)‏ 


—\£o- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):َُ6ا ب ييا 


(A) [SVP [حضر متأخرا إلى المدرسة]‎ NPL SUIT 


كما ذكرنا من قبل أن القواعد النحوية يجب أن تكون قادرة على توليد وتحليل الجمل 
الصحيحة» وتعيين البنية النحوية المناسبة للجمل ال معنية بالتحليل وكا تبين لنا إنه يمكن 
ميل البنية النحوية للجمل عن طريق التمثيل الشجري كما في الشكل )4-8( فعلينا 
أن نتساءل عن Gale‏ القواعد التي تستطيع تمثيل البنية النحوية للجمل» وللجواب عن 
هذا بالنظر إلى التمثيل الشجري في الشكل (A E)‏ يمكن صياغة مجموعة من القواعد 


(4) کا في‎ 
(4) ميحج 5(ا)‎ VP )ب(‎ VP >V ADV PP 
(ZPP — P NP (3 NP— DET N 


فالقاعدة )1( تفترض إمكانية تكوين الجملة من مركب اسمي (NP)‏ متبوع بمركب 
فعلي (VP)‏ والقاعدة (ب) تفترض أن المركب الفعلي (VP)‏ يتكون من فعل (V)‏ 
وحال (ADV)‏ بالإضافة إلى مركب حرفي (PP)‏ والقاعدة (ج) تفترض أن CSM‏ 
الحرفي (PP)‏ يتكون من حرف (P)‏ متبوع بمركب اسمي (NP)‏ ثم أخيرًا القاعدة (د) 
تفترض أن المركب الاسمي (NP)‏ يتكون من أداة تعريف (DET)‏ واسم (N)‏ وقد 
أطلق تشومسكي على تلك القواعد قواعد التركيب العباري Phrase structure))‏ 
(Grammar (PSG‏ وسميت بذلك لأنها تستطيع تحديد كيفية تكوين الجمل من 
مركبات وكيفية تكوين المركبات من كلات» وهذه الافتراضات تلقي الضوء على 
دور تشومسكي في تطوير علم اللغة الرياضي وتطوير قواعد صورية يمكن من خلاها 
صياغة قواعد النحو في صورة قواعد رياضية. 

وبتطبيق تلك القواعد التي تعتمد على الفئات النحوية (Categorial grammar)‏ 
في (A)‏ وحدها نستطيع الحصول على التمثيل الشجري في الشكل :)١5-5(‏ 


EA 


A 
N DET 


NP 
Pa P ADV V 


N DET 


الشّكل £— Y Y‏ : التمثيل الشجري للجملة CV)‏ باستخدام القواعد في )4( 
بالإضافة إلى تلك القواعد التى تعتمد على الفئات النحوية والتى استطاعت تكوين 
التمثيل الشجري في الشكل (Y o£)‏ فا مكون النحوي يحتوي أيضًا على معجم به قائمة 
من مفردات اللغة مع معلومات عن فئة تلك المفردات ويمكننا هنا أن نتخيل أن المعجم 
المستخدم لدينا في (V) ila‏ يحتوي على المفردات المبينة في الشكل .)١١-٤(‏ 


v حضر‎ 
N طالب‎ 
N مدرسة‎ 
ADV متأخرا‎ 
P Ji 
DET ال‎ 


الشّكل VTE‏ معجم به قائمة من مفردات اللغة وفئتها. 
وما OV We‏ إلا إدراج المفردات المتواجدة في المعجم والتي ها فئة محددة تحت 
الفئة التي تنتمي إليها داخل التمثيل الشجري في الشكل )١5-4(‏ والمسئول عن ذلك 
قاعدة تُعرف باسم قاعدة إدراج المفردات وبذلك نتمكن من تمثيل الجملة كما في الشكل 
)£-& 1( 


-Yív- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n——‏ 


N DET P ADV V 


حضر ye‏ إلى ال مدرسة 
الشّكل ٤-٤‏ : التمثيل الشجري للجملة (V)‏ باستخدام القواعد في )4( مع إدراج المفردات. 
وني ختام هذا العرض ننتهي إلى أن المكون النحوي للغة يحتوي على قواعد تعتمد 
على الفئات النحوية قادرة على تمثيل التركيب الداخلي للجمل والمعجم وقاعدة إدراج 
المفردات وتلك المكونات قادرة على توليد التمثيل الشجري في الشكل )١5-5(‏ 
للجملة في (V)‏ وهو نفسه الموجود في الشكلان )4-6( .)٠١-٤(‏ ومن هنا نود أن 
ننوه إننا قد حققنا الهدف المنشود من بناء تلك القواعد النحوية في )4( والتى استطاعت 
تحديد البنية التركيبية للجملة SCV)‏ هو موضح في الشكل .)١5-5(‏ 


Y", Y‏ القدرة التوليدية للقواعد وقياسها 

تتميز اللغات الطبيعية بالقدرة الإبداعية العالية» فالقواعد التي تم بناؤها في (9) سوف 
تكون قادرة على توليد عدد لا Sle‏ من الجمل وليس فقط الجملة الممثلة في الشكل )£ 47( 
[ASS‏ زادت عدد القواعد وأيضا زاد حجم المفردات المدرجة داخل القاموس تزداد ote‏ الجمل 
التي يمكن توليدها؛ فعلى سبيل المثال إذا تم دخول كلمات - مثل فصل» ولد» صبي» ذهب 
ll deas -‏ دايع رجره تنس d CO Q dell‏ يمك d Je dr‏ الكل و 


الولد حضر متأخرا إلى المدرسة. 
الطالب حضر متأخرا إلى الفصل. 
الصبى حضر متأخرا إلى الفصل. 
الولد ذهب متأخرا إلى المدرسة. 
الولد وصل متأخرا إلى الفصل. 
الصبي وصل متأخرا إلى الفصل. 


الطالب حضر متأخرا إلى المدرسة. 


الصبى حضر متأخرا إلى المدرسة. 
الولد حضر متأخرا إلى الفصل. 


الطالب ذهب متأخرا إلى المدرسة. 


الصبى ذهب متأخرا إلى المدرسة. 


الطالب وصل متأخرا إلى الفصل. 


الشّكل al: Yo ٤‏ التى يمكن توليدها من القواعد في (A)‏ 


-Y£A- 


وإذا تم تعديل القواعد في (9) إلى )1 CO‏ بحيث يكون وجود الحال في المركب الفعلي 
المع الذي امنتطاع تر edel ad‏ الكل )00-8( فإنه يمكن GIS Jed adj‏ 


.)١5-5( الشكل‎ 
(1) (SNP VP )ب(‎ VP — V (ADV) PP 
)ج(‎ PP — P NP (3) NP — DET N 

الطالب حضر متأخرا إلى المدرسة. الولد حضر إلى الفصل. 

الصبي وصل متأخرا إلى المدرسة. الصبي حضر إلى المدرسة. 

الولد ذهب متأخرا إلى الفصل. الطالب حضر إلى المدرسة. 

الصبى حضر متأخرا إلى الفصل. الولد حضر إلى المدرسة. 

NU‏ جه ail dele‏ الطالب حضر إلى الفصل. 

الولد حضر متأخرا إلى المدرسة. الصبي حضر إلى الفصل. 


الشّكل 15-4: الجمل التى يمكن توليدها من القواعد في .)٠١(‏ 

لذا نحن بحاجة إلى اتساع في المعجم واتساع في عدد القواعد التي تعتمد على 
الفئات النحوية لتوليد عدد لا هائي من جمل اللغة الصحيحة» ولا بد من قياس 
كفاءة القواعد التي تم بناؤها وذلك عن طريق توصيف poles‏ محددة للتأكد من 
كفاءة القواعد وقدرتها على وصف تراكيب الجمل وصفا صحيحًا من أجل غاكاة 
أفضل للنموذج اللغوي البشري. فقام تشومس كي بوضع ثلاثة معايير 
أمساسية لقياس كفاءة القواعد النحوية CY‏ لغة وهي: معيار كفاءة 
الرصد «(Observational Adequacy)‏ توصف قواعد اللغة Ligh‏ قد 
حققت معيار كفاءة الرصد إذا كانت هذه القواعد قادرة على ol‏ بصحة أو 
خطاً الجممل نحويًا Ys,‏ وفونولوجيًا وهو أقل المعايير كفاءة. ومعيار كفاءة 
الوصف p: «(Descriptive Adequacy)‏ القواعد معيار كفاءة الوصف إذا 
كانت قادرة على التنبؤ بصحة أو خطاً الجمل نحويًا ودلاليًا وفونولوجيًا (كفاءة 


~\£4- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
L.‏ 7 ييا 


بنية الجمل في اللغة وتقدم وصمًا يعطي تفسيرًا Ue‏ لتراكيب اللغة كم في 
النموذج البشري لابن اللغة. ومعيار كفاءة التفسير (Explanatory Adequacy)‏ هو 
fel‏ معيار يحدد كفاءة القواعد. ويتحقق معيار كفاءة التفسير إذا كانت القواعد قادرة أن 
Gad‏ درجة كفاءة الوصف بالإضافة إلى شر طين أساسين. الأول: إذا كانت القواعد 
لا تحتوي على أي قاعدة تتنانى مع مبدأ كتابة القواعد في أي لغة من اللغات أي أن 
القواعد تستطيع وصف جمل اللغة في ظل وجود مجموعة من الشروط 
المحددة والمتفق عليهاعالميافي كتابة القواعد. 

فعلى سبيل المثال فإنه من غير المتوقع أن تحتوي أي لغة على قاعدة نحوية تنص على 
أنه يمكن أن تحلل الجملة إلى مركب اسمى ومركب فعلى في السادسة مساءً؛ فتلك 
Guta‏ لذ يكن أن tal ol Gd seed go‏ من GLAU‏ ال وؤلاف asad YY‏ عن 
Ole gles‏ غير لغوية (الزمن) وذلك منافٍ لشروط بناء القواعد في أي لغة من اللغات 
(Y 403 Chomsky)‏ أما الشرط الثاني فهو أن تحاكي القواعد الطبيعة النفسية الواقعية 


والقدرة الذهنية للنموذج البشري للغة. 
۲ "- هل تبنى قواعد التركيب على فكرة وجود المركبات والفئات النحوية 
أم على فكرة وجود الكلمات؟ 


تتسم القواعد التي تعتمد على الفئات النحوية بقدرتها على تحقيق مبدأ التعميم. 
فمنظومة النحو تتم ببناء نظام قادر على تحديد توزيع وترتيب الكلمات داخل تركيب 
الجمل. فأي محاولة لبناء نظام لا يعتمد على الفئات النحوية لن يكون قادرًا على بناء 
قواعد لتكوين المركبات وتوزيعها داخل الجمل واستخدام هذه القواعد لتوليد عدد 
لا نمائي من الجمل. فإذا رفضنا فكرة القواعد المبنية على المركبات التي تعتمد على 
الفئات النحوية» فلن يكون هناك وسيلة لبناء قواعد لتحليل وتوليد مجموعة الجمل 
مثل تلك الموجودة في )١١(‏ إلا باستخدام قواعد تبنى على الكلمة » وهذا ما يعرف ب 


.(Word-based Grammar) أو‎ (Noncategorial Grammar) 


—\or- 


Ay) 


Gs‏ هذه الحالة يتم توليد الجمل في )١١(‏ عن طريق عمل مصفوفة ڌ 


كلمة من OS‏ الجملة وتوضع كل كلمة في عمود |S‏ نرى في الشكل :)١7-5(‏ 


تضم مكان لكل 
Y \\ E‏ 
طالب ناجح 
مدرس ذكي 
ius‏ فاضل 


4 


ال 


A 


J 


1 


طالب 


0 t 
ماهر | قدم‎ 
وصف‎ 
ناجح‎ 
ise 
i 


۳ 


ال 


الشكل 17-4: مصفوفة تضم مكان لكل كلمة من كلمات الجملة. 


١ 


ال 


وعندها يكون بناء مجموعة من القواعد لتوليد أي جملة عن طريق اختيار كلمة من 


ودا وها olZYI‏ 


(Y) 


عمود رقم C0‏ ثم من عمود رقم OO‏ ثم من عمود (Y)‏ 
في بناء القواعد يؤدي إلى مشكلات منهجية عدة منها: (( التخلي عن مبدأ التعميم في 
القواعد؛ فلا بد من ذكر كل كلمة بعينها بدلا من ذكر فئتها. (ب) نجد تكرارا واضحا 
بين الكلمات وارتباطها بمكان توزيعها؛ فمجموعة الكلات في العمود رقم (Y)‏ هي 
نفسها الكلمات في العمود رقم CO‏ ورقم .)٠١(‏ (ج) لا يمكن لهذه المنهجية التعامل 
مع ظاهرة التكرار في بناء المركبات داخل الجملة؛ يمكن للجملة أن يزداد طوها إلى ما 
لا نهاية بسبب العطف مثلا كما في QUY)‏ 


cul‏ محمد وعلي وأحمد وخالد وطارق وعمر. 


—\o\—- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ييا 


فإن أي محاولة لبناء قواعد لا تعتمد على الفئات النحوية لوصف ظاهرة التكرار 
في اللغة بشكلها المطلق ستكون مستحيلة. وإلا سنضطر إلى بناء مصفوفة من أعمدة 
لا نبائية من الكلمات كلما تكرر العطف. فيستحيل على هذا النوع من القواعد تفسير 
القدرة التوليدية اللا نبائية للجمل. وسيؤدي ذلك بدوره إلى خرق المبدأ الرئيسي لبناء 
القواعد الذي لا بد فيه أن تتوافر إمكانية بناء عدد محدود من القواعد قادرة على توليد 
عدد لا هائي من الجمل» ولكن في هذه الحالة ستكون عدد القواعد لا نهائية مع زيادة 
عدد الأعمدة في المصفوفة الذي يعتبر أمرا غير مقبول كمبدأً بناء للقواعد اللغوية. 

ولكن إذا ما اعتمدنا في نظام القواعد على الفئات النحوية فنجد أن جميع المشكلات 
السابقة لن يكو ن لما وجود. فظاهرة التكرار يمكن التعامل معها بسهولة في نظام القواعد 
التى تعتمد على الفئات النحوية وتفسير إمكانية توليد عدد لا نهائى من الكلمات طبقا 
للقواعد الموصفة. ومن نقاط القوة أيضًا التي ترجح كفة نظام القواعد التي تعتمد على 
الفئات النحوية أن هذه القواعد تمثل نظامًا أكثر إحكامًا وتقييدًا من نظام القواعد التي 
لا تعتمد على الفئات النحوية. فنظام القواعد التي تعتمد على الفئات النحوية يفترض 
وجود قيود تحدد القدرة التوليدية للقواعد شرط أن تكون مكونة من عدد محدد من 
الفئات العبارية (Phrasal Categories)‏ والفئات المعجمية (Lexical Categories)‏ 
وهي N, NP, V, VP, ADV, ADVP)‏ ...) ولا يمكن الخروج عن هذه الفئات (لمزيد 
من المعلومات يمكن ee‏ على )1988 .((Radford,‏ 

إِذَا نستنتج مما سبق أن نظام القواعد التي تعتمد على الفئات النحوية هو الأكثر 
تعبيرًا عن طبيعة بناء القواعد وذلك لثلاثة أسباب: V jl‏ قدرته على التعميم 5 GU‏ 
قدرته على التعامل مع القدرة التوليدية اللا نهائية للجمل وأخيرًا طبيعته الأكثر إحكامًا 
وتقييدًا. فلا بد GY‏ عمل يسعى إلى بناء قواعد نحوية قادرة على توليد وتحليل الجمل 
العربية أن تستمر في هذه المهمة لنصل إلى قواعد نحوية عالية القدرة الإنتاجية في توليد 
وتحليل عدد لا uie‏ من الجمل. 


—YoY- 


Y^, ۳‏ — البنية السطحية والبنية العميقة للحملة 
إن قواعد النحو لا بد أن تكون قادرة على توليد كل البنى السطحية للجمل في اللغة 
وهذا يتحقق عن طريق مجموعة من القواعد التي تعتمد على الفئات النحوية والمعجم 
وقاعدة إدراج المفردات. ولكن تلك المكونات وحدها لم يكن لدا القدرة على التعامل 
مع أنواع أخرى من التراكيب تظهر في اللغات الطبيعية؛ فعلى سبيل المثال الحملة المبنية 
للمجهول في (۱۳): 
الأقلام ضعت في الحقيبة QY)‏ 
فإن القواعد التي تعتمد على فئّة المفردة التي تم بناؤها سوف تتنباً Ú‏ أن الجملة 
OY) à‏ غير صحيحة» وذلك LEY‏ تنتهك الإطار النحوي Subcategorisation)‏ 
O(frame‏ البني للفعل الوضع)؛ فالفعل «(وضع» يحتاج إلى متعلقات نحوية eu‏ 
تركيب الجملة بشكل صحيح» كقولنا «الرجل وضع الأقلام في الحقيبة» GUS‏ ورائه 
مركب اسمي ومركب حرفي ولكن في الجملة OV)‏ نجد أن الفعل (وضع) GL‏ ورائه 
مركب حرفي فقط ولا GL‏ ورائه مركب اسمي. 
ولكن الجملة في OY)‏ هي جملة صحيحة ولكن حدث فيها تحريك للعبارة الاسمية 
th ies be das Geb ge (UM)‏ الكت ed] E‏ ريات 
المركب الاسمى من مكانه الأصلى (بعد الفعل) في البنية العميقة للجملة كا في (VE)‏ 
وهنا يجب أن فرق toy‏ الجميقة للتجملة وهي الشكل by bl!‏ الظاهر ile)‏ 
والبئية السطحية وهي على عكس البنية العميقة. l‏ 
وضع الأقلام في الحقيبة. Qc,‏ 


في (V8)‏ استخدام لب يعبر عن موضع الفاعل ونجد أن الفعل (وضع) يقع 
داخل المركب الفعلي متبوعا بالمركب الاسمي (الأقلام) متبوعا بالمركب الحرفي (في 
الحقيبة)» ومن هنا يمكن LI‏ أن نستنتج أن الجملة في CAST)‏ من البنية الأساس 
(Base)‏ في CO E)‏ التي تم توليدها خلال المكون النحوي المبني على أساس القواعد 
والمعجم وقاعدة إدراج المفردات فقط. 


-—\oy— 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—.- 9‏ 


وبناء القواعد ذه الطريقة يعاني من مشكلات أخرى. فعلى سبيل المثال سوف 
يتمكن المكون النحوي من توليد الجملة في (V0)‏ ولكنه لا يتمكن من توليد الجملة في 
TOR)‏ 
الرجل أكل التفاحة. (\o)‏ 
التفاحة أكلها الرجل. OD‏ 
وذلك OY‏ تلك القواعد تس: تستطيع أن تقدم الوصف الذي يظهر فيه ال لمتعلقات النحوية 
لكل مسند في أماكنها المناسبة. ومن هنا كان لا بد من نشأة نوع آخر من القواعد هي 
ينقل المركب الاسمي إلى موقع الابتداء وهذا التحويل يتناول نقل الركن الاسمي الذي 
يقع على يسار الفعل إلى موقع الابتداء تاركا مكانه عائدا يعود عليه في الموقع الذي كان 
يشغله (زكرياء ۱۹۸۳). ولذلك لا بد من إعادة تنظيم النحو التحليلي لإدراج مكون 
تحويلي كا في الشكل :)۱۸-٤(‏ 


)1( قواعد تكوين الجملة على أساس (Categorial rules) àzà‏ 


(Lexicon) المعجم‎ (Y) [7 (Base) الأساس‎ 


(Lexical insertion rule) قاعدة لإدراج المفردات‎ (Y 


(Deep Strucutre) البنية العميقة‎ 


المكون التحويلي: )£( قواعد التحويل (Transformational Rule)‏ 


(Surface Strucutre) البنية السطحية‎ 


الشّكل 1-4 : منظومة النحو التحليلي بناء على وجود مكون تحويلي. 
وهكذا يمكن لقواعد النحو في وضعها الحالي أن تكون قادرة على توليد Je‏ من 
اللغة وهذا يتحقق عن طريق مجموعة من القواعد والمعجم وقاعدة لإدراج المفردات 


—\og-— 


وأخيرا قواعد التحويل. وعلينا أن نستمر في تحسين قدرة النحو من أجل الوصول إلى 
قواعد على درجة عالية من الكفاءة قادرة عل التعامل مع جميع تراكيب اللغة. 
OLS M-Y, ٤‏ الوسيطة 


إذا نظرنا إلى التتابع «كتاب زيد الجديد» في الشجرة النحوية في الشكل )١9-5(‏ 
سنجد أنه ينقسم إلى ثلاث وحدات (AP) (NP) 5 (N)‏ 


NP 


N NP AP 


ME S 


الجديد زيد كتاب 


الشّكل :١19-4‏ الشجرة النحوية لجملة «كتاب زيد الجديد)». 

ففي هذا التمثيل التركيبي يمكن UJ‏ القول OL‏ المركب الوصفى «الجديد» في الشكل 
(Y4- £)‏ يصف الاسم «كتاب» حيث يخرج فرع المركب الوصفي والاسم «كتاب» من 
نفس النقطة. ولعل ذلك ليس بالدقة الكافية» لأن المركب الوصفى «الجديد» يصف 
LS)‏ زيد) ولیس «كتاب» فقطء كما أن «كتاب زيد» يمثل وحدة أيضا بدليل صحة 
العطف عليه بمركب من نفس النوع كا في «كتاب زيد وقلم عمرو جديدان»» S‏ يصح 
معه الإسناد (C$‏ في «هذا كتاب زيد)؛ وذلك لا يظهر في الشكل .)۱۹-٤(‏ ولذلك لا بد 
من تعديل التمثيل التركيبي ل الشكل )£ 7 OY A‏ إلى التمثيل الموضح في الشكل (Y =E)‏ 


dj‏ كتاب 


الشّكل Y ١-4‏ التمثيل التركيبي ا معدل ل الشكل (V4=0)‏ 


—loo- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


فنجد أن في الشكل )£ CS UCT‏ الوصفى «الجديد» يصف المركب الجديد (غير 
المسمى» «كتاب 3 وكا ذكرنا أن هذا e cas‏ رو od‏ ا 
عن فئة هذا المركب $$( والتي تضم التتابع (N - NP)‏ ولعلنا في الوهلة الأولى نظن 
أنه مركب اسمي OY (NP)‏ الرأس اسم «كتاب» CN)‏ ولكن لا يمكن أن يكون 
هذا منطقيا إذ إن هذا يعتبر نقصًا في التوصيف النحوي لأن المركب الاسمي الأعلى 
لن يكون له رأس. ومن هنا يمكن استنتاج أن هذه العبارة تمثل مركب cda p‏ هذا 
المركب أكبر من الاسم (ND)‏ وأصغر من المركب الاسمي (NP)‏ وهنا نجد فجوة 
كبيرة داخل نظام قواعد التركيب العباري (PSG)‏ للتعبير عن هذا المركب فلا توجد 
فئات وسيطة ما بين الفئات المعجمية والفئات العبارية في إطار عمل تلك النظرية في 
الوصف التركيبي للجملة ما يؤدي إلى عدم قدرة أي نحو توليدي من الوصول إلى 
مستوى «كفاءة الوصف» حيث أنه لن يكون قادرا على وصف هذا النوع من التراكيب 
في «كتاب زيد الجديد». فظهر مفهوم نظرية (X—bar‏ 9 ووّضعت هذه النظرية عام ١91١‏ 
بواسطة نعوم تشومسكي لتعالج النقص الموجود في التوصيف النحوي في PSG‏ وتم 
تطويرها فيما بعد بواسطة راي جاكندوف VAVV ple‏ وتنص هذه النظرية على أن كل 
اللغات الطبيعية البشرية تتبادل تراكيب متشابهة محددة ها نفس البنية العميقة والتي 
يمكن قثيلها في الشكل .)7١-5(‏ 


الشّكل Y ١-4‏ تمثيل البنية العميقة باستخدام نظرية „X-bar‏ 
حيث يستخدم الحرف G(X)‏ هذه النظرية لكي يعرف الفئات المعجمية الأساسية» أو 
رؤوس العبارات؛ فهناك أنواع من رؤوس العبارات وهي ON)‏ للأسماء مثل الضمائر 
الشخصية وأسماء الإشارة .... إلخ و(۷) Ds JSU‏ للصفات (A)s‏ للظروف 
(P);‏ لحروف الجر (D),‏ للمحددات كالأدوات على سبيل Sot (C)y JA‏ 
العطف. وتحدد رؤوس العبارات نوع أو فئة العبارات فنجد أن N‏ تنتج مركب اسمي 


-\oyT- 


Adjective Phrase)) تنتج مركب وصفي‎ Jy (VP) تنتج مركب فعلي‎ NP: V)) 
(PP) تنتج مركب حرفي‎ Py (Adverb Phrase (AP)) 3b تنتج مركب‎ Ay (CUP 
تنتج مركب تكميل‎ Cs (Determiner Phrase(DP)) تنتج عبارة تحديدية‎ Ds 
و28 يسميان‎ XP op ye SIC N-E) وف شكل‎ .(Complementizer Phrase(CP)) 
والرمز × يسمى رأس العبارة» ويسمى أيضًا بالإسقاط‎ (Projections) إسقاطين‎ 
حيث أنه الوحدة النهائية ولا يمكن إسقاط أي‎ (Zero Projection) الصفري‎ 
وحدات نحوية منه وعلى هذا فإن كل عبارة لها إسقاط صفري واحد أي رأس واحدة.‎ 
(Maximal Projection) تسمى بالإسقاط الأقصى‎ XP والوحدة العليا المسماة ب‎ 
تحتها أي عدد من الإسقاطات. فكل‎ cox حيث أنه أكبر وحدة نحوية يمكن أن‎ 
الإسقاطات الواقعة بين الرأس والإسقاط الأقصى تسمى بالإسقاطات الوسيطة‎ 
ويمكن وصف الإسقاطات الوسيطة بالوحدات غير النهائية وذلك لإمكانية‎ 
يسيطر على الإسقاط‎ XP gai) حيث أن الإسقاط‎ the إسقاط وحدات نحوية‎ 
أو‎ (spec) (Specifiery Lol .X الذي يسيطر على الإسقاط الصفري‎ XB الوسيط‎ 
أما‎ (XO «المخصص النحوي» وهي الكلمة أو العبارة أو الجملة التى تحدد العنصر‎ 
سلامة‎ SISY «المكمل» وهو العنصر النحوي اللازم‎ Jomi ( (Complement » 
أو «الملحق» فهي الكلمة أو العبارة أو الجملة التي‎ Cadjty (Adjunct التركيب » أما‎ 
ولكن ليس من الضروري وجوده نحويا. ويمكنا رؤية التمثيل‎ OO تصف العنصر‎ 

النحوي لأشكال المركبات المختلفة في الشكل .)۲۲-٤(‏ 


NP 
کے‎ N 
NB AP 
N NP 
A) 
qi 7 A 


الشّكل E‏ -۲۲: التمثيل النحوي لأشكال OLS M‏ باستخدام نظرية .X-bar‏ 
وبعد أن تعرفنا على فكرة وجود المركب الوسيط من خلال نظرية X bar‏ يمكننا 
dole]‏ تمثيل في الشكل )۲۰-٤(‏ إلى الشكل )£ QUY‏ 


—\ov— 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
53 — ييا 


Noun Phrase Verbal Phrase Adjective Phrase Adverbial Phrase 


PB adjunct " DB adjunct ' i 
[UN PEUT E | 


الشّكل YN E‏ تعديل التمثيل التركيبي للشكل )0— « (Y‏ باستخدام المركب الوسيط. 
لمزيد من ترسيخ مفهوم المركبات الوسيطة يمكننا أخذ مثال آخر فإذا نظرنا إلى الجملة 


«الرجل ذهب إلى البيت بسرعة»» نجد أن تمثيل الجملة على النحو الموضح في الشكل 
Y (YEE)‏ يعبر عن حقيقة أن المركب (بسرعة) يصف الحدث (ذهب إلى البيت). 


5 
ے‎ a a 
VP NP 
i PR 
ADVP PP ۷ N DET 
L\ 9 X9 
إلى البيت بسرعة‎ 


الشّكل £ —£ Y‏ التمثيل الشجري لحملة «الرجل ذهب إلى البيت بسرعة» 
باستخدام قواعد التركيب العباري (PSG)‏ 
وهنا لا بد أن نجمع بين الفعل (ذهب) والمركب ال حرفي (إلى البيت) اللذان يعبران 
معا عن وحدة واحدة - حيث أن المركب p‏ البيت) هو المكمل للفعل (ذهب) - 
لذلك Gh‏ دور المركبات الوسيطة للتعبير عن ذلك كما في الشكل (55-5): 


—\oA- 


ی 
VP NP‏ 
PASS‏ | 
VB N DET‏ 
| 
ال رجل ADVP VB‏ 
PP V‏ 
Mog. NL UH‏ 
ذهب إلى البيت 


الشّكل 4 -70: ربط الفعل (ذهب) والمركب الحرفي (إلى البيت) في وحدة واحدة (VB)‏ 

حيث نجد أن المركب الفعلي يتكون من إسقاط وسيط والذي يتكون بدوره من 
إسقاط وسيط آخر (يتكون من الفعل والمركب الحرفي) ومركب ظرفي. أي أن المركب 
الظرفي أصبح يصف المركب (ذهب إلى البيت). 

وبذلك يمكننا القول بأن قواعد النحو أصبحت الآن على درجة أعلى من الكفاءة 
ويمكنها الوصول إلى مستوى كفاءة الوصف؛ حيث تستطيع Je‏ مستوى أعم من 
تراكيب اللغة المختلفة وعلى ذلك فإنه ينبغى الاستمرار في تحسين قدرتمها AST‏ فأكثر 
حتى تصل إلى درجة عالية من الكفاءة تمكنها من التعامل مع التراكيب اللغوية بشكل 
كامل. 

ه , ۳-الفصل بين التركيب والدلالة 

قبل طرح قضية الفصل بين التركيب والدلالة لا بد أن نشير إلى ظاهرة لغوية تتميز 
بها اللغات الطبيعية وهي الالتباس التركيبي؛ ويقصد هنا باللبس التركيبي أن يكون 
هناك أكثر من تحليل للجملة بعد تطبيق قواعد التحليلء فعلى سبيل المثال الجملة في 
AVY)‏ 

عقد مؤتمر للسلام في الشرق الأوسط. QV)‏ 

فإذا نظرنا إلى القواعد التي سوف يتم تطبيقها للحصول على البنية التركيبية للجملة 

في C V)‏ فنجد أن تطبيق القواعد في (VA)‏ يصل بنا إلى تمثيل الجملة خلال شجرتين. 


—\o4q- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
—« ييا 


() NP29 N NP PP 
(HNP N PP 
(<)PP Prep NP 

(^) (SNP> De N 
(t) NP Det N ADIP 
(c) ADJP Det Adj 
(€) NP> N NP 


فعند تطبيق القواعد في (VA)‏ لتحليل الحملة في CVV)‏ يمكن الحصول على البنية 
الموضحة في الشجرة في الشكل (55-5). 


NP 


الشّكل ه-5:: التحليل الشجري للجملة QW)‏ 

حيث يتركب المركب الاسمي «عقد E ga‏ للسلام في الشرق الأوسط» من اسم (ND‏ 
(عقد) ومركب اسمى (NP)‏ آخر «مؤتمر للسلام» ومركب حرفي d» (PP)‏ الشرق 
الأوسط» (I- A) dis‏ ويتكون OSM‏ الاسمى Egad‏ لا (ODL‏ من اسم ١عقد)‏ 
ومركب حرفي «للسلام» ىا في VA)‏ 27( ويتكون المركب الحرني اللسلام» من حرف 
«ل» ومركب اسمي «السلام» كما في (4١-ت)‏ ويتكون ذلك المركب الاسمي من أداة 
تعريف (D‏ واسم «سلام) كما في (۸١-ث)»‏ أما المركب الحرفي «في الشرق الأوسط» 
الممثل داخل المربع في الشكل OTE‏ فهو يتكون من حرف «في» ومركب اسمي 


a\ tee 


«الشرق الأوسط» وذلك من خلال القاعدة (OVA)‏ والمركب الاسمى «الشرق 
الأوسط» يتكون من أداة تعريف «ال» واسم «شرق» ومركب وصفي MET‏ خلال 
القاعدة في YA)‏ 7( وأخيرا يتكون هذا المركب الوصفي من أداة تعريف «ال» وصفة 
«أوسط) من خلال القاعدة في (/١-ح).‏ 

ولكن إذا نظرنا إلى القواعد في CVA)‏ فإننا نجد إنه يمكن تطبيق القواعد بشكل 
آخر وعند ذلك يمكننا الحصول على تمثيل مختلف للبنية النحوية للجملة في CVV)‏ 
وهوالموضح في الشكل )۲۷-٤(‏ والذي يختلف عن التمثيل في الشكل )£ Qv‏ 


الشّكل :۲۷-١‏ تحليل شجري آخر للجملة (VY)‏ 


حيث يتركب المركب الاسمي «عقد مؤتمر للسلام في الشرق الأوسط» من اسم 
(N)‏ «عقد» ومركب اسمي (NP)‏ آخر «مؤتمر للسلام في الشرق الأوسط» خلال 
القاعدة (/١-خ).‏ 

فإذا نظرنا إلى الشكل )£ 17( نجد أن المركب الحرفي «في الشرق الأوسط» وصف 
على أنه يرتبط ب «عقد GE sll‏ أي أن عقد المؤتمر تم في الشرق الأوسطء وتم تمثيل 
ذلك في الشجرة النحوية عن طريق إضافة فرع من المركب الاسمي» وذلك على BIE‏ 
ما نجده في الشكل (١-۲۷)؛‏ حيث نجد أن الجملة تم تحليلها على أساس أن المركب 


eyes 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


ا à‏ «في الشرق الأوسط» يرتبط بالمركب الاسمي «السلام»» أي أن «السلام» تم 
تحديده بأنه في الشرق الأوسط. وتم التعبير عن ذلك في توصيف الشجرة النحوية حيث 
أن المركب الحرفي متصل بفرع من المركب الاسمي «السلام». وهنا نجد أن اختلاف 
التركيب النحوي كما في الشكلين (YI-0)‏ (77-5) أدى إلى اختلاف في المعنى 
وتفسير الغموض في الجملة في (VV)‏ وعلينا أن ننوه أن ما حدث من تفسير للغموض 
الذي هو ظاهرة دلالية لا يعد تداخل بين التركيب والدلالة OY‏ التداخل معناه 
استخدام مفاهيم من مستوى آخر (الدلالة) لوصف تركيب الجملة فما حدث هنا يدل 
على أن النحو بشكل طبيعي يمكنه أن يفسر المعنى دون استخدام مفاهيم من DY‏ 
وتعد تلك القدرة حسب ما وصفه تشومسكى أحد المميزات التى تضاف إلى قدرة 
القواعد التحوية التي Lgl‏ القدوة عل تكوين بنى تحوية تفسر معاني fad‏ الطبيعية, 

ويتفق هذا مع إشكالية ما أسماه تشومسكي باستقلالية النحو Autonomy of)‏ 
(Syntax‏ حيث یری تشومسكي «أن التركيب مستقل عن YI‏ ولا علاقة له (Ue‏ 
(سيرل» GL CV VA‏ يتم النظر إلى منظومة النحو دون الرجوع إلى المعنى أو السياق. 
ولعلنا هنا قد لفتنا النظر إلى علاقة التأثير ما بين منظومة النحو والدلالة. فوجود تفاعل 
بين المنظومتين لا يعني الدمج ee‏ ولمزيد من التفاصيل عن قضايا اللبس التركيبي 
يمكنك الاطلاع على )2004 (Al-Ansary, & El-Kareh,‏ 


f‏ - مدخل إلى معالجة ت ركيب الجملة آليا 

بعد أن تعرفنا في الأجزاء السابقة على كيفية تكوين البنية التركيبية للجمل وكيفية 
بناء قواعد تسمح بتحديد البنية التركيبية للجمل» فنكون بذلك قد ألقينا الضوء على 
بعض المفاهيم الأساسية عند تناول التحليل النحوي للجمل؛ فالتحليل النحوي يعد 
من المتطلبات المامة والمحورية في العديد من تطبيقات معالحة اللغات الطبيعية كالترجمة 
وأنظمة الإجابة على الأسئلة وتطبيقات نظم الحوار» فمثل هذه التطبيقات تتطلب 
معرفة معاني جمل اللغة الطبيعية. ولإتقان معاني الجمل لا بد من توفر التركيب النحوي 
للمكونات الجوهرية للجملة. وال هدف الأسامى من التحليل النحوي هو تحديد 
الأراكيب all god‏ تعب عن مدى Gulla‏ بي جل اللغة الطبيعية ومغانيها Miyao,)‏ 
6). فالأبحاث التي تتضمن العلاقة بين الجملة ومعناها تعد من الأبحاث الصعبة 


exe 


والضرورية لفهم اللغة الطبيعية. فما علينا OV‏ إلا ely‏ نظام يمكن أن يقوم بتنفيذ مهمة 
تكوين البنية التركيبية للجمل آلياء وهو ما يعرف باسم المحلل النحوي حيث إن إتاحة 
المحللات النحوية الآلية هى نقطة انطلاق للمعالحة الذكية للغات الطبيعية. 


Y‏ و ٤‏ - تصميم منطق بناء المحللات النحوية 

تتعدد الا تجاهات والتقنيات المتبعة عند بناء المحللات النحوية فيتم بنائها بالاعتماد 
على اتجاهين للتحليل النحوي؛ التحليل النحوي من أعلى إلى أسفل والتحليل النحوي 
من أسفل إلى أعلى ويمكن من خلال هذين الاتجاهين الوصول إلى نفس التركيب 
النحوي للجملة على الرغم من الاختلاف في طريقة تطبيق وترتيب القواعد في كلا 
الاتجاهين. وعلى المحلل النحوي أن يحدد ما إذا كان الاتجاه المتبنى للتحليل غير محدد 
أو دد )1997 kès (Dobrovolsky, Katamba, & O'Grady,‏ يل سوف نتناول 
عرض كل اتجاه بالتفصيل ويلي ذلك توضيح لفكرة التحديد وعدم التحديد في LEYI‏ 
المتبنى أثناء التحليل النحوي. 

" التحليل النحوي من del‏ إلى أسفل 

التحليل النحوي من أعلى إلى أسفل هو أحد طرق بناء المحللات النحوية ويتم فيه 
بناء الشجرة النحوية من خلال النظر إلى الجملة (أعلى مستوى) وتجزئتها عن طريق 
القواعد النحوية» يتم خلال هذا النوع من التحليل التعرف على العلاقات بين أجزاء 
SM‏ 

وفي هذا الاتجاه يبدأ المحلل النحوي بتطبيق القواعد لبناء شجرة للجملة المدخلة 
ea‏ من الوحدات غير النهائية وانتهاءً بالوحدات النهائية؛ أي مفردات الجملة» ومرورًا 
بعدد من القواعد والقيود التي تعمل على اختيار الكلمة المناسبة وتسكينها في المكان 
الملائم GU‏ هيكل الشجرة النحوية وفقًا لفئة الكلمة. فعلى سبيل JEL‏ إذا أدخلنا جملة 
«الرجل ذهب إلى البيت» فيتم تطبيق عدد من القواعد كى| هو في VA)‏ لبناء الشجرة 
النحوية في الشكل )۲۸-٤(‏ لهذه الجملة وسوف نقوم بعرض تلك القواعد بالتفصيل: 


- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


(3) 

(5s 

(—)NP VP 
(2)Det N Verb PP 


(—)Det N Verb Prep NP pr cm 

(c) Det N Verb Prep Det N VP NP 

(c) ال‎ N Verb Prep Det N _ p 
PP V N Det 

(¢) رجل ال‎ Verb Prep Det N A 

; NP Prep 

Prep Det N‏ ذهب رجل ال (د) 

Det N N bet‏ إلى ذهب day‏ ال (ذ) 

ال رجل ‏ ذهب dE‏ ال البيت N‏ ال إلى ذهب رجل ال )2( 


بيت ال إلى ذهب رجل ال )2( 
الشكل E‏ -۲۸: بناء الشجرة النحوية لجملة «الرجل ذهب الى البيت» من أعلى إلى أسفل. 

طريق القاعدة في V4)‏ -أ) وبعد ذلك يتم تحديد أن هذه الجملة تتكون من مركب اسمي 
وآخر فعلي ا في (9 ١‏ -ب»» وأن المركب الاسمي الذي تم الحصول عليه خلال -١9(‏ 
Co‏ يتكون من أداة تعريف واسم IS‏ هو مبين في )14 (o7‏ وكذلك المركب الفعلي في 
(۱۹-ب) يتكون من فعل ومركب حرفي كما في 10 Go-‏ وأن المركب الحرفي يتكون 
من حرف ومركب اسمي كما هو مبين في (۱۹-ج) وهذا المركب الاسمي في (9١-ج)‏ 
يتكون من أداة تعريف واسم كا في )14 7( وعند هذه المرحلة يكون قد تم الوصول 
إلى العلاقة البنائية لأجزاء الجملة؛ وتم أيضا تحديد الفئة النحوية لكل جزء في الجملة. 
أما في القواعد V8)‏ 7(« (9١-د),‏ )46714 467190 467390 (۱۹-س) فيتم 
فيه تسكين كل مفردة من مفردات الجملة في المكان المناسب لما داخل الشجرة النحوية 
التي تم بناء فروعها. 


SAI 


a‏ التحليل النحوي من أسفل إلى أعلى 
هذا التحليل هو المقابل للتحليل السابق؛ حيث يقوم المحلل النحوي بتقسيم الجملة 
المدخلة إلى مفردات ووحدات أصغر هى نقطة الانطلاق في التحليل؛ ففى هذا الاتجاه 
يبدأ المحلل النحوي بتطبيق القواعد لبناء شجرة للجملة المدخلة بدءًا من الوحدات 
النهائية وانتهاءً بالوحدات غير النهائية. فيتم تقسيم الجملة إلى كلمات وكل كلمة يتم 
وسمها بالفئة النحوية التي تنتمي إليها ويتم استخدام هذه الفئات لبناء علاقات تركيبية 
بين الكلمات بعضها البعض لتكوين مركبات أكبر» يتم الربط بين هذه المركبات لبناء 
الشجرة التحليلية الكاملة للجملة. فعلى سبيل المثال إذا أدخلنا جملة «الرجل ذهب إلى 
البيت)؛ ob‏ المحلل يقوم أولاً بالتعرف على المفردات المكونة للجملة من واقع المعجم 
وهى KD‏ - «رجل) - (JD - (1p - a3‏ - «بيت» وهى على الترتيب أداة تعريف». 
اسم» فعل» حرف» أداة تعریف» اسم. ويمكن توصيف مراحل التحليل بشكل مبسط 
عن طريق عدد من القواعد الموصفة في )7١(‏ لاستخراج الشجرة في الشكل )8 47( 
)۲۰( 
بيت ال إلى ذهب رجل ال )( 
بيت ال إلى ذهب رجل Det‏ (ب) 


(©) DetN بيت ال إلى ذهب‎ a 

. . VP NP 

(2) Det N Verb بيت ال إلى‎ a SIN 
m PP V N Det 

(c) DetN Verb Prep بيت ال‎ P 

(c) DetN Verb Prep Det بيت‎ NP Prep 

(¢) Det N Verb Prep Det N N Det 

(3) NP Verb Prep Det N الت‎ Ji doen p S 


(3 NP Verb Prep NP 
() NP Verb PP 
(5) NP VP 
(س)‎ S 
بناء الشجرة النحوية لجملة «الرجل ذهب الى البيت» من أسفل إلى أعلى.‎ : Y A— 5 الشكل‎ 


2 e 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ييا 


ففي القاعدة )* -Y‏ يتم التعرف على المفردات المكونة للجملة وبعد ذلك يتم 
وسم تلك المفردات كما في القواعد رقم )8 e Y 0 CET) CHV) COV‏ 
G7 Y D (e 7 Y 9)‏ بعد ذلك يبدا المحلل في تكوين مركبات أكبر ففي القاعدة -۲١(‏ 
د) و(۲۰-ذ) يتم تكوين مركب اسمي من خلال الدمج بين أداة التعريف والاسم 
الذي تم الحصول عليهم في (١۲-خ).‏ وكذلك من خلال )+ OY‏ يتم تكوين المركب 
الحرفي عن طريق الجمع بين حرف الجر والمركب الاسمي الذي يليه والذي قد تم 
الحصول عليهم من خلال القاعدة )+ GAY‏ وبعد ذلك يتم الدمج بين المركب الحرفي 
والفعل اللذين قد تم الحصول عليهم خلال القاعدة (١۲-ر)‏ ليتكون مركب فعلي WS‏ 
هو موضح في القاعدة (١۲-ز)‏ لتصبح (S) AA‏ في النهاية تتكون من مركب اسمي 
وآخر فعلي. 

وبعد اختيار المحلل النحوي لأحد الاتجاهين السابقين» فإن المحلل النحوي عليه 
أن يحدد ما إذا كان الاتجاه المتبنى للتحليل غير محدد (Nondeterministic Parsing)‏ 
أو حدد ‘(Deterministic Parsing)‏ حيث تظهر الحاجة إلى التحليل غير المحدد عند 
ظهور جمل تحتمل أكثر من تحليل» حيث إن القواعد تكون قادرة على أن تسلك أكثر من 
اتجاه. فهذه الطريقة من التحليل تسمح بإنتاج جميع التراكيب الممكنة في حالة الجمل 
التى يحدث فيها لبس لغوي» وذلك لتحديد التحليل الأفضل للسياق. ففى هذه الحالة 
يذ السلا اعفار افده امن مره القواعد المحتملة لتركيب الجملة تاركا 
إشارة تمكنه من معرفة أن في هذا الموضع كان هناك قاعدة أخرى محتملة وبعد ذلك 
يبدأ مساره في التحليل مع القاعدة المختارة ويستمر في تطبيق القواعد قيد التطبيق 
التي تمكنه من استكمال مساره في بناء البنية التركيبة للجملة» وعندئذ يتراجع البرنامج 
(Backtrack)‏ إلى موضع الإشارة التي تركها في بداية مساره الأول لتجربة القاعدة 
الأخرى البديلة التي تمكنه من استخراج البنية التركيبية الأخرى للجملة؛ فعلى سبيل 
المثال عند تحليل الجملة في VV)‏ نجد أن المحلل أثناء تحليله للبنية التركيبية للجملة ظهر 
له من خلال القواعد أن الجملة تحتمل أكثر من تحليل؛ حيث إن المركب الاسمي «عقد 
مؤتمر للسلام في الشرق الأوسط» يمكن تحليل تركيبه وفقا للقاعدة IVA)‏ فهو بذلك 
يسلك المسار الذي يحقق التمثيل في الشكل )£ (VIR‏ ويمكن أيضا أن يسلك التحليل 
مسار آخر bol‏ بقاعدة أخرى محتملة في (/1١-خ)‏ فهو بذلك يسلك المسار الذي GÀ‏ 


Ai 


التمثيل في الشكل )£ eue (Y V7‏ الطريقة يكون المحلل قادرًا على استخراج أكثر من 
تركيب نحوي للجملة. 

Gl‏ إذا كان اتجاه التحليل محدد فإن المحلل ينتقل من تطبيق قاعدة إلى أخرى سالكا 
مسار واحد فقط لاستخراج بنية تركيبية واحدة فقط للجملة؛ فلا يضطر البرنامج إلى 
التراجع إلى ikä‏ سابقة لاختيار قواعد بديلة أخرى. ولمزيد من التفاصيل عن اتجاهات 
بناء المحللات النحوية ينصح بالاطلاع على )2007 (Grune, & Jacobs,‏ 


-o‏ اتجاهات بناء المحللات النحوية 


o, Y‏ - الاتجاه المبنى على القواعد 

عند بناء المحلل النحوي بالاعتماد على هذا الاتجاه تتم كتابة معلومات عن البنى 
النحوية للغة في شكل قواعد نحوية» وهذه هي القواعد التي يتم من خلاها التحليل 
النحوي للنص المدخل من أجل إنتاج الأشجار النحوية» ويتم عادة تخزين معلومات 
نحوية عن الكلمات المفردة» وهذه المعلومات تتمثل في نوع الكلمة في المعجم والتي 
يصل إليها المحلل قبل تطبيق القواعد اللغوية. ويمكن تلخيص خطوات بناء المحلل 
النحوي اعتمادا على القواعد اللغوية )2002 Kiril Ribarov,‏ كما في الشكل )£- 6( 


الشّكل Y- E‏ خطوات بناء المحلل النحوي المبني على القواعد. 


-\W- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


في المخطط الموضح بالشكل )£ 7 (f‏ يتم وسم المدخل صرفيًا ثم البدء في بناء البنية 
النحوية للجملة وذلك عن طريق تطبيق عدد من القواعد الموجودة والتي تم الحصول 
عليها مسبقًا على أساس جمل محللة يدويا. وعلى الرغم من انتشار استخدام المحلل المبني 
على القواعد في أنظمة ALLL!‏ الآلية للغة الطبيعية» إلا أن هناك العديد من التحديات 
لبناء هذا المحلل فهو مثلاً يحتاج إلى لقواميس حاسوبية بالإضافة إلى الحاجة إلى لغويين 
حاسوبيين ذوي مهارة عالية لكتابة ولمراجعة القواعد اللغوية. 


۲ ه- الاتجاه المبنى على الإحصاء 

اعتمد المحللون المعاصرون في السنوات الأخيرة على هذا الاتجاه الإحصائي في 
بناء المحللات النحوية نظرًا للقدرة المباشرة والسريعة لإخراج النتائج. حيث يتميز 
ذلك الاتجاه بالقلة الملحوظة للقواعد المطلوبة لبناء المحلل النحويء وأيضًا القدرة على 
ضبط المحلل من أجل تحليل نوع معين من النصوص عن طريق استخراج المعلومات 
الإحصائية. ويعتمد هذا الاتجاه على بناء نموذج إحصائي هدفه تحديد الاحتمالات 
الإحصائية للتحليلات المختلفة للجمل. وتعتمد هذه الاحتمالات على استخدام 
عدد ضخم من النصوص الموسومة بمعلومات لغوية كعينات تدريبية. ويعد المحلل 
النحوي الإحصائي أحد الوسائل الشائعة لحل مشكلة اللبس التركيبي» حيث يقوم 
النموذج الإحصائي بحساب ST‏ التحليلات احتمالا اعتمادًا على العينات التدريبية. 
ومن أكثر التحديات وضوحًا في هذا الاتجاه اشتراط وجود كميات كبيرة من المدونات 
الموسومة C eo‏ ونحويًا لقلة وفرتها. ومن الملاحظ أن دقة المحللات الإحصائية الحالية 
جيدة ولكنها لم ترقى إلى Bo‏ التحليل اليدوي. يمكن الاطلاع على المزيد عن تقنيات 
التحليل الإحصائي بالرجوع إلى )2013 (Bunt, & Nijholt,‏ 


۳ ه- الاتجاه المختلط المبني على القواعد والإحصاء 

تواجه المحللات المبنية على القواعد مشكلات وتحديات عديدة مثل اللبس التركيبي» 
bs‏ أن المحللات الإحصائية تعتمد بشكل أسامى على وجود عينات تدريبية ضخمة من 
أجل الحصول على نتائج أفضل بشأن احتمالات التحليل التركيبي للجمل. أي أنه يوجد 
حد أقصى من الكفاءة يمكن تحقيقها عند se Vl‏ على اتجاه تحليل دون الآخر )& Foth,‏ 


-\ M- 


(Menzel, 2006‏ فعلى الرغم من أن المحلل الإحصائي قد يعطي أداء أفضلء إلا أنه 
يواجه مشكلات عديدة نتيجة عدم دعم قدرته على مراعاة مرونة اللغة والترتيب الحر 
للكلات داخل تركيب الجمل )2008 .(Selvam, & Thangarajan,‏ 

وللتغلب على هذه العيوب في كلا الاتجاهين ظهرت بعض الآراء التى تنادي بتبني 
دمج القواعد اللغوية مع العمليات الإحصائية. فنجد أن محللات الاتجاه المختلط aul‏ 
على القواعد والإحصاء تعتمد على القواعد الخاصة باللغة بالإضافة إلى بعض العمليات 
الإحصائية التي تعتمد على الأاحتالات التي توضح مدى انتشار القواعد ومدى تطبيقها 
في الاستخدام اللغوي. فقد وجد أن اللغويون يجيدون كتابة القواعد النحوية الخاصة 
باللغة ويفضلون oie VE‏ على الاتجاه المبنى على القواعد ولكن نظرًا لكثرة الغموض 
التي تسببه القواعد اللغوية كان هناك اتجاه إلى se VI‏ على بعض العمليات الإحصائية 
التى تساعد في عملية فك الغموض التى تسببه القواعد النحوية. وأصبحت المحللات 
bos‏ المبنية على الاتجاه القواعدي EET‏ في الآونة الأخيرة أكثر نجاحا إلى حد 
عاق ell aedis‏ و du‏ العارما تعن deo disi‏ 
القواعد والإحصاء يمكن الاطلاع على )2006 Foth, & Menzel,‏ 


”- دقة المحللات النحوية 


يمكن النظر إلى المحللات النحوية وتصنيفها من حيث التطبيقات القائمة على هذه 
المحللات وذرجة تحليل وتفصيل المحلل إلى: محلل نحوي سطحي وعلل نحوي عميق: 
فطبيعة بعض التطبيقات الخاصة بالمعالجة الآلية للغات الطبيعية لا تستدعي بناء محلل 
نحوي عميق وكامل» خاصة تلك التطبيقات التى تعتمد على كمية ضخمة من النصوص 
المدخلة؛ حيث إن المحلل odis‏ كر كانتا قط من al ual eI Je‏ ليث 
من أجلها هذه التطبيقات. فعلى سبيل SEM‏ برامج استرجاع المعلومات euet‏ 
أسامي على وجود محلل نحوي سطحي يعمل على استنباط وتحديد المركبات الاسمية 
es Mis‏ الفعلية. أما التطبيقات الأخرى مثل الترجمة الآلية القائمة على القواعد 
فطبيعتها تستوجب وجود محلل نحوي عميق لفك الالتباس اللغوي واستكشاف كل 
التحليلات الممكنة للجملة. ولسنا هنا بصدد الحديث عن اتجاهين مختلفين للتحليل 
النحوي يتناقضان في طبيعة المسلك المنهجي لكل منهاء إن| هي خطة عمل يتم توجيها 


-Yu- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n— 5‏ 


حسب الحدف المنشود من بناء المحلل النحوي والتطبيقات الأخرى المستفيدة منه. وكا 
أن كلا الاتجاهين (العميق والسطحي) يختلفان في منهجية ورؤية التعامل مع النص 
المدخلء إلا أن الفصل بينهما فصلا جذريًا يشكل عقبة في طريق التطبيقات المبنية على 
أساس تحليلي سطحي بحت دون التطرق لآليات التحليل العميق. فعلى سبيل JEU‏ 
نجد أن أنظمة تحويل النص المكتوب إلى منطوق تقوم في الغالب على أساس محلل نحوي 
سطحي وظيفته فصل وتقسيم الجمل إلى كتل نحوية ووحدات يمكن الربط بينها داخل 
اليكل الداخلي للجملة. ولكن هذه العملية لا تنطبق [slo‏ بسهولة ويسر. ففي بعض 
الحالات لا يمكن الاكتفاء بآلية التحليل النحوي السطحي بمعزل عن التحليل العميق 
الذي pads‏ معلومات لغرية ولرل أكثر Line‏ ودقة..وعليه فإ لا مانع من الدمج بين 
النهجين من أجل الوصول إلى رؤية أفضل وتحليل لتركيبات لغوية مختلفة بشكل أكثر 
فاعلية ومرونة )2002 .(Balfourier, Blache, & Van Rullen,‏ 


5 ,3- التحليل السطحي 

ويعرف LA‏ بالتحليل المقداري أو التحليل البسيط أو التحليل الجزئي. ويعرف 
التحليل السطحي بأنه تحليل للجمل عن طريق عملية تجزئة النص إلى كتل نحوية؛ أي 
تقسيم النص إلى كتل» كل كتلة عبارة عن مجموعة كلمات متجاورة تمثل OSS‏ يسهل 
ales‏ ومعالحته Balfourier, Blache, & Van Rullen, 2002; Ibrahim,) Suai‏ 
lis, . (Mahmoud, & El-Reedy, 2016; Mohammed, & Omar, 1‏ النوع 
من التحليل لا يعتمد على التحليل المفصل لمكونات الحملة» ولا دورها في الجملة 
الرئيسية. وعليه فإن الهدف الأساسى من المحلل السطحى هو JEE‏ الجملة عن طريق 
a‏ ارات l‏ 

ولقد تعددت اتجاهات التحليل السطحى من حيث اعتتادها على القواعد اللغوية 
داخل بنية الجملة ومن Gs el tae‏ عل الاس لات والتكرارات الإحصائية داخل 
النص. فنجد أن الاتجاه المبني على القواعد يعتمد على استخدام ade‏ من المحولات 
محدودة الحالات (Finite State Transducers)‏ لتقوم بمهمة تحديد الكتل الاسمية 
والكتل الفعلية إلخ بناء على القواعد المخزنة. أما الاتجاه المبني على الإحصاء يتم فيه 
تحديد الكتل النحوية عن طريق التعرض لكمية مناسبة من البيانات التدريبية تم وسمها 


Wee 


من قبل وتحديد الكتل اللغوية فيها. وتتميز التطبيقات المبنية على آلية التحليل السطحي 
بأنها تتعامل مع كمية ضخمة من النصوص المدخلة؛ فعلى سبيل المثال برامج استرجاع 
المعلومات وبرامج استخراج المعلومات وبرامج التلخيص الآلي تعتمد بشكل أساسي 
على وجود محلل نحوي سطحي يعمل على استنباط وتحديد المركبات الاسمية OLS My‏ 
الفعلية من الجمل ral‏ وير il Ale DLE geal‏ أيضًا تقوم على تحديد العلاقات 
النحو- دلالية داخل بنية السؤال لاستنباط تراكيب بعينها كتحديد الفاعل والمفعول به 
والمكان والزمان إلخ. 

يمكن وصف التحليل السطحي بشكل مبسط كما هو في الشكل (1-5) حيث 
يمر المحلل بعدد من المراحل. أولا مرحلة الإعداد وتشخيص النص إلى كلمات. وهذه 
مرحلة أولية #هدف إلى إعداد النص وذلك عن طريق تقسيم وفصل النص إلى كلمات. 
ثم GE‏ مرحلة تصنيف أقسام الكلام حيث يتم في هذه المرحلة تصنيف كل كلمة من 
olds‏ الجملة حسب نوع كل كلمة وذلك لا يتم بمعزل عن المعجم. وبعد ذلك QU‏ 
مرحلة التكتيل أي تقسيم النص إلى كتل كل ALS‏ عبارة عن مجموعة كلمات متجاورة 
تمثل تركيب» كل تركيب يسهل تمثيله ومعالجحته. وأخيرًا ننتهي بالعلاقات النحوية وهي 
eiiean y‏ هكر الخيلة: l‏ 


ae‏ الجملة لكلمات هر حلة الوسم لكلامي 
POS tagging Tokenization‏ 


مرحلة التكتيل إعطاء الكلمات الصفات الصرفية التحوبة 
Morpho-syntactic classes ia :‏ 
of the words Chunking‏ 


A الكلمات في أجزاء ربط الأجزاء عن طربق‎ ess 
Determine relations with Words grouped as chunk 
[NP S! [الطالب‎ [VP] 


الشّكل 1-4: مراحل التحليل السطحي. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا | — n————‏ 


فعلى سبيل المثال جملة (ذهب الطبيب الجديد إلى المستشفى) يتم تحليلها كا في الشكل 
(¥Y-£)‏ 


[pp iati [إلى‎ [xe [الطبيب الحديد‎ [ve ذهب‎ [ 


الشّكل Y Y ٤‏ التحليل السطحى لجملة «ذهب الطبيب الجديد إلى المستشفى». 

ومن أمثلة المحللات السطحية: محلل كولينز (Collins Parser)‏ هو محلل سطحى 
إحصائي تم تطويره بداية كأطروحة للدكتوراه في جامعة بنسلفانيا. وهذا المحلل 
لا يستخدم فقط من أجل تحليل الجمل نحوياء ولكن أيضًا يمكن استخدامه كأحد 
المكونات لتطبيقات أخرى مثل برامج التلخيص (LY‏ وبرامج استخراج المعلومات 
وبرامج الترجمة IV‏ وبرامج الإجابة على الأسئلة )2004 (M. Kaplan, R., et al.,‏ 

ومن الخصائص التى تميز هذا المحلل أن الفئات اللغوية في الجمل المحللة يمكنها 
التمييز فيها بين رأس cens Sd y ALL‏ والملحقات. وهذه الفروق يمكن أن توجه 
في بعض التطبيقات لاستخلاص علاقات دلالية هامة. 


5١‏ التحليل العميق 

ويقصد بالتحليل النحوي العميق أنه على المحلل النحوي الآلي توفير جميع المعطيات 
اللازمة للتحليل النحوي الأعمق. والحديث عن العمق هنا ليس حديث عن النهج 
المبني على القواعد في مقابل النهج المبني على الإحصاء. فالاتجاه نحو التحليل العميق 
يستفيد من كلا المنهجين من أجل الوصول إلى أقصى معلومات لغوية نحوية يمكن 
استخلاصها من الجمل. وأحد أهداف المحلل العميق القدرة على اكتشاف و تحليل كل 
التراكيب النحوية التي ينتجها الإنسان» والقابلية للتعامل مع كل الظواهر اللغوية؛ 
القياسية منها وغير القياسية. والجدير SUL‏ أن المحللات العميقة لا هدف إلى تقديم 
تحليل نحوي كامل للجملء كما قد يعتقد القارئ من المعنى الحرفي للعمق. وإنما الهدف 
الأساسي من التحليل العميق هو السعي إلى حل التراكيب النحوية التي تنطوي على 
درجات متفاوتة من العمق والتعقيد» وهذا يتوقف على مدى التعقيد ووجود المعلومات 
اللغوية الأساسية اللازمة لحل مثل هذه التراكيب )2001 (Chanod,‏ 


-\VY- 


وتواجه التطبيقات اللغوية القائمة على آلية التحليل العميق بعض العقبات التي تعوق 
عملهاء فعلى الرغم من العمق والثراء اللغوي الذي قد يقدمه المحلل النحوي العميق» 
إلا أن تطبيقه يشكل عبئًا مقارنة بالمحلل السطحى. فنجد أن المحلل السطحى قد يكون 
GLI‏ أفضل من الناحية التطبيقية لعن Lin fal yo‏ عامل السرعة CREER‏ 
في التحليل» فالمحلل السطحي يتعامل مع الجمل من حيث تقسيمها إلى كتل أصغر دون 
الخوض في تفاصيل ومشاكل أخرى كفك الالتباس والتعامل مع المحذوفات. وهذا 
بالطبع ul‏ على حساب العامل الوقتي للمحلل النحوي. وكذلك OB‏ طبيعة المحلل 
السطحي وكونه يتعامل مع كتل لغوية قصيرة تم فصلها من الجملة؛ فإن هذا يتطلب 
مساحة أقل من ذاكرة التخزين ويؤثر على سرعة وعملية التحليل (Collins,1996)‏ 
كما أنه في حالة إذا أخفق المحلل العميق في تحليل cle dle‏ يقوم بإسقاط الجملة بكاملها 
نتيجة لنظرته الكلية للمدخلات. إما في حالة المحلل السطحى فإذا أخفق في تحليل 
ila‏ فإنه يقوم بإسقاط الكلمات التي يصعب التعامل معها وتكتيلها في كتل حددة دون 
اللجوء إلى إسقاط الجملة كاملة. ويمكننا تقديم مثال للتحليل العميق؛ الجملة (الولد 
ذهب بسرعة إلى البيت) يتم تحليلها کا في الشكل (77-5): 


[الروم[ولد ]رمم [ذهبى[بسرعة ]روم [إلى م[الروم [بيت ]بر ve[pp[Nel‏ ]و 


الشّكل 4 -": التحليل العميق لجملة «الولد ذهب بسرعة إلى البيت». 


v‏ - أمثلة للمحللات النحوية 

OYI‏ وبعد عرض بعض الاتجاهات المتبعة عند بناء المحلل النحوي الآلي» سنتعرف 
على بعض أمثلة المحللات الآلية الحالية للعربية. ووجب التنبيه على أن العربية لازالت 
تعاني من نقص في المحللات الآلية والآدوات اللازمة لبنائها. ومن المحللات الحالية 
محلل ستانفورد الإحصائي والمحلل التفاعلي (IAN)‏ وهو ما سنقوم بشرح آليات تحليله 
للجملة العربية بالتفصيل. 


aoe Ali 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
١|‏ عط ييا 


\ ۷- محلل ستانفورد الإحصائي 

وهو محلل إحصائي يستخدم المعرفة المكتسبة من جمل محللة يدويا في محاولة لإنتاج 
التحليل الأرجح لجمل جديدة. وهذا المحلل يعمل على اللغة الانجليزية ولغات أخرى 
منها الإيطالية والبرتغالية والبلغارية والعربية. 

ومحلل ستانفورد الإحصائي يستخدم تقديرات احتمال الأرجحيّة القصوى 
CLA (Maximum Likelihood Estimates)‏ الاحتالات من القواعد النحوية. 
وهناك مصدران أساسيان للخطأ في التقدير ((2010 CO? Reilly,‏ أولا التحيز الذي 
يكون احتهال الأرجحيّة القصوى له صفر. وثانيا الخطأ في اختيار العينات» والذي 
يرجع لمشكلة ضخامة البيانات المدخلة بسبب العدد الكبير من القواعد النحوية. 
ولذلك فإنه من المقبول عمومًا أن يقدم المحلل شكل متجانس يمكن أن يساعد في 
تحسين عمومية تقديرات احتهال الأرجحيّة القصوى في هذه IL‏ وتحسين الأداء. وفي 
الشكل )£ -£ (Y‏ مثال لتحليل جملة «قام الرئيس بافتتاح المرحلة الجديدة من المشروع» 
داخل محلل ستانفورد: 


Stanford Parser 


Please enter a sentence to be parsed: 
قام الرئيس بإفععاح المرحلة الجديدة هن المشروع‎ 


Language: Arabic ¥ Sample Sentence 


Your query 
المرحلة الحديدة من المشروع‎ cu قام الرئيس‎ 


Tagging 
الرئيس 80 قام‎ /DTNN بافساح‎ INN المرحلة‎ JDTNN الجديدة‎ [DTJJ SANN المشروع‎ IDTNN 


(NP (DTNN (رالرئيس‎ 
(NP (NN C9») 
(NP 
(NP (DTNN (المرحلة‎ (DTJJ الجديدة‎ (( 
(PP (IN ^) 
(NP. (DTNN المشررع‎ )))))))) 


الشكل 4-4 : مثال لتحليل جملة «قام الرئيس بافتتاح المرحلة الجديدة من المشروع» داخل محلل ستانفورد. 


=\Vi= 


(Interactive analyzer- IAN) clad! المحلل‎ -V , Y 
بوضع أدوات لمساعدة‎ (UNDL) قامت منظمة لغة التواصل الرقمية العالمية‎ 
اللغويين في إنتاج الموارد اللغوية المختلفة. ومن هذه الأدوات التي وضعتها المنظمة‎ 
لتحليل اللغات الطبيعية. وهو محلل مبنى على نظرية‎ (IAN) المحلل التفاعلى‎ alaf 
وهي نظرية لسانية توليدية من النظريات اللغوية»كم| تم شرحها من قبل في‎ X-bar 

جزء المركبات الوسيطة )2010 .(Alansary, Nagi, & Adly,‏ 
والمحلل النحوي التفاعلي يتبنى اتجاه التحليل النحوي من أسفل إلى del‏ ولتوضيح 
كيفية حدوث التحليل الآلي النحوي في المحلل التفاعلي سيتم شرح المراحل التي يجب 

استخدامها لنقل جملة عربية إلى شجرتها النحوية عن طريق الجملة في QUO‏ 
أكل الولد تفاحة لذيذة (Y3)‏ 


أولاً مر الجملة على القاموس الذي يحتوي على مفردات اللغة وبعض الصفات التي 
توضح ob shall‏ اللغوية الخاصة بتلك المفردات كالمعلومات المورفولوجية التي تدل 
على الوسم الخاص che‏ ولمزيد من التفاصيل يمكنك الاطلاع على الرابط: 
http: //www.unlweb.net/wiki/index.php/Part of speech.‏ 
ففي حالة «أكل الولد تفاحة GLU‏ فإن المحلل النحوي سوف يقوم باستخراج كل 
المفردات التي تطابق كلمات الجملة من القاموس كا في الشكل )£ 007( 


(V)‏ [أكل] 
[Js] (N)‏ 
[J] (DET)‏ 


(N)‏ [ولد] 
(N)‏ [تفاحة] 
(J)‏ ]54.0[ 


الشكل 0-4: نموذج من القاموس يمثل مفردات الجملة في QUO‏ 


ففى «أكل» يوجد هناك غموض حيث يوجد «JS»‏ بوسم اسم و «أكل» بوسم 
فعل. ولكن في هذه الجملة يجب اختيار JSD‏ بوسم فعل وليس اسم. وبالتالي فإذا 


—\Vo- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
—« ييا 


كانت القواعد قادرة على اختيار الفعل بدلا من الاسم فهذا سيسهل عملية التحليل. 

ولكن في حالة اختيار «أكل» بوسم اسم فيأتي دور صفة التفاعلية في المحلل. لأن المحلل 
وبعد الانتهاء من اختيار المدخلات المعجمية المناسبة لمفردات الجملة العربية فيبداً 

المحلل بحذف المسافات بين مفردات الجملة المدخلة لتصبح شكل الجملة المدخلة كا 

في الشكل (TI-E)‏ 

["أكل"] ["ال" ] ["ولد"] ["تفاحة" ] "52:33 [ 


الشّكل € -5: تحديد قائمة مفردات الجملة. 
ثم يبدأ المحلل النحوي بناء المركبات النحوية المختلفة؛ فعند تجاور أداة التعريف 
«Jp‏ - التي تعتبر المخصص النحوي الاسمي — والاسم «ولد) يبنى المركب الاسمي 
النهائي ى) في الشكل )£ Qv‏ 


الشّكل ٤‏ -۳۷: بناء المركب الاسمى ANP)‏ 
وعند تجاور الاسم «تفاحة») والصفة GLID‏ يتم بناء المركب الاسمي الوسيط كا 


في الشكل :)۳۸-٤(‏ 


الشّكل 8-4: بناء المركب الاسمى الوسيط (NB)‏ 


-\V3- 


ثم GE‏ القاعدة النحوية التي تنص على أنه عند تجاور فعل ومركب اسمي ومركب 
اسمي آخر فسوف يتم تبديل مكان المركب الاسمي الأول «الولد» ليسبق الفعل لكي 
يكون هذا المركب موجود في موقع المخصص النحوي للفعل في الشجرة النحوية 
وهكذا يكون المركب الاسمي الثاني «تفاحة لذيذة» في موقع المتمم النحوي للفعلء كا 
في الشكل :)۳۹-٤(‏ 
EE" TE" JI T] NP‏ ["أكل"] 1[218"تفاحة"] ["لذيذة"]] 


الشكل 4-4: تجاور المركب الاسمي الوسيط ١‏ تفاحة لذيذة» بجانب الفعل «أكل). 
وهذا المركب الاسمي الوسيط الذي تم بناؤه في الشكل )۳۸-٤(‏ يمثل المفعول 
به والذي يتم ربطه بالفعل «أكل» وبالتالي نصل إلى بناء المركب الفعلي الوسيط كما في 
الشكل :)5١0-5(‏ 


١-4 JS‏ 5: تكوين المركب الفعلي الوسيط «أكل تفاحة لذيذة». 
ولاستكال بناء الشجرة النحوية Gh‏ دور القاعدة النحوية التي تربط المركب 
الاسمي النهائي «الولد» والتي تمثل الفاعل مع المركب الفعلي الوسيط لتكوين المركب 
fail‏ النهائي كا في الشكل .)5١-5(‏ 


-\VV- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—————— — J|‏ 


الشّكل 4 ::١1-‏ تمثيل التركيب النحوي للجملة في QUO‏ 
وهكذا يكون قد تم بناء الشجرة النحوية التي تمثل التركيب النحوي للجملة في 
(Y Y)‏ ويمكننا أيضا LES‏ التمثيل النحوي للجملة في (Y V)‏ كما في الشكل )٤١-٤(‏ 
خلال المحلل التفاعلي. 


[S:1] 
{org} 

أكل الولد تفاحة لذيذة 
{Jorg}‏ 

{unl} 

51203, — :01) 


VB:03, أكل‎ ; :02) 
N8:02)ةذيذل‎ , (تفاحة‎ 
NP-01, ال‎ , 34) 
{/unl} 

L5] 


الشّكل 1-4 : تمثيل التركيب النحوي للجملة ني )11( باستخدام المحلل التفاعلي. 
ونجد أن المحلل يقوم بوضع أرقام أمام الفروع المكونة للشجرة لربطها داخل 
هيكل الشجرة النحوية؛ فالمركب الاسمى الوسيط «تفاحة لذيذة» الذي يمثل KII‏ 
النحوي للفعل يسمى في الشجرة التي تنتج من المحلل ب CY‏ ويربط هذا المركب مع 


-\VA- 


الفعل «أكل» ليكون المركب الفعلي الوسيط الذي يسمى ب eC Yo‏ المركب الاسمي 
النهائى «الولد» الذي يمثل المخصص النحوي للفعل ويسمى ب 2١١١‏ الذي la; à‏ 
بالمركب الفعلي الوسيط الذي يسمى Y‏ ليكون المركب الفعلي النهائي «أكل الولد 
تفاحة لذيذة». وهكذا نجد أن التمثيل النحوي في الشكل (5-4) يطابق التمثيل 
الشجري في الشكل .)5١-5(‏ 


-A‏ بعض النقاط البحثية الحامة من أجل دعم خطة طريق لمعالجة التركيب 
فى اللغة العربية 
أ. دراسة القواعد المنظمة لتتابع الأسماء داخل المركبات الاسمية. 
ب. دراسة إمكانية تقسيم الكلمات العربية بشكل يدعم معالجة التركيب النحوي. 
ج. دراسة السمات اللغوية المختلفة للكلمات للمساعدة في ضبط وانتظام تطبيق 
القواعد. 
د. دراسة الإطار النحوي BUI Ol al‏ العربية المختلفة وذلك لإثراء المعجم 
بمزيد من المعلومات النحوية والتي لما فوائد جمة تدعم التحليل النحوي 


a ll fool! 
العربية دعم| للمعجم‎ ole jal (Selection Constraints) ه. دراسة 43 > الانتقاء‎ 
ولدوره الجليل أثناء التحليل النحوي.‎ 


و. دراسة إمكانية الوصول لقواعد تحديد حدود المركبات المختلقة داخل الجملة. 
ز. التحليل المنهجي لعلاقة منظومة النحو العربي بمنظومتي الصرف والدلالة. 


ح. إعادة النظر في جهود النحاة العرب القدامى من أجل تنظير أفضل لربط 
النظريات الحديثة بالجهود القديمة. 


ط. تفعيل استخدام النظريات المختلفة للغات الآخرى» مع ضرورة الأخذ في 
الاعتبار طبيعة اللغة العربية. 


. تطبيق نظرية X-bar‏ على التراكيب المختلفة في الجمل العربية. 


G 


-11/4- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


ببليوجرافيا مرجعيّة 


). جون سيرل. تشومسكى والثورة اللغوية» مجلة الفكر العرں» عدد AYT AHA‏ 


ZA 


diia st‏ زكرياء Rudi Sally xul ME‏ وقزاغد اللغة العرية» اة 


الجامعية للدراسات والنشر والتوزیع» MAT Y‏ 
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-\A\- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا 


21. Radford, A. (1988). Transformational grammar: A first course (Vol. 
1). Cambridge University Press. 

22. Selvam, M., Natarajan, A. M., & Thangarajan, R. (2008). Structural 
parsing of natural language text in tamil using phrase structure hy- 
brid language model. International Journal of Computer, Informa- 
tion and Systems Science, and Engineering, 2008, 2-4. 


-\AY- 


-١‏ الأنطولوجيا ودلالة اللغة 

eil QAI التحليل‎ -Y 

#ات ALLL‏ لذلالة التكفية ف dey pS‏ 

dor dp d afi us نجي‎ oy Yo osa - 
والعمل على إزالته.‎ AUI الالتباس‎ -o 

Ail QAI تطبيقات التحليل‎ - ١ 

RE الود‎ E I OEY 
ما بعد المستوى الُحْجَمي.‎ YI التحليل‎ -A 


-YAY- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها botes‏ 


-1١85- 


-١‏ الأنطولوجيا ودلالة اللغة 

يعود الانشغال بالدراسات VII‏ إلى أقدم عصور الحضارات الإنسانية في التاريخ 
البشري OS‏ حيث انشغلٍ العلماء والمفكرون والفلاسفة ورجال الدين بتأمل العام 
SEE‏ وظواهره واجتهد كل منهم في محاولة تفسير معانيها وتَظوها سويًا في سياق عام 
وف أساق معطية: 


Spe cer ae tale كان أحد أنضج قير النظامية التي‎ loys 
وهو‎ - (Ontology) ed LA الوجودية 2 ما يعر عنه بمصطلح‎ d aa 
«الوجود أو الكينونة)‎ CIS اسمٌ مشق من لفظة «ألطو؛ اليونانية القديمة التي تعني‎ 
بدراسة‎ gg ويتبواً المصطلح مكانته في الفلسفة كعنوان على أحد مباحثها الرئيسية‎ - 
وتصنيف الموجودات/ الكائنات والعلاقات بينهاء والتمييز بين العام‎ coger ll طبيعة‎ 
والخاصء وبين الكليات والجزئيات» وبين ما هو جوهرٌ وما هو كائنٌ» وبين ا لخصائص‎ 
والسنفاك ا‎ AI 

JE لعا‎ wee لالجو‎ a e 
المكوّنة له عند مفاصله الأساسية‎ OEE العمل على الوصول إلى تقسيم طبيعي لكل‎ 
بغرض اكتشاف الفئات التي تندرج تحتها موجوداته. وفي حين أسهب الفلاسفة في‎ 
جدل لا يكاد ينتهي في| بينهم منذ منتصف القرن العشرين الميلادي حول التعريفات‎ 
لم يقوموا في‎ eel والمقاربات والطرق المثل لبناء أنطولوجيات مكتملة ومتماسكة»‎ 

Noes حا مكتيملة رسفم‎ ya des afa de 

Ul‏ ما bag‏ من ناحية عملية في هذا الفصل من الكتاب فهو ما قام به الباحثون 
في JE‏ علوم الحاسبات عمومًا وفي حقل الذكاء الاصطناعي على وجه الخصوص» 
حيث التقطوا منذ منتصف سبعينات القرن العشرين الميلادي أهمية مفهوم الأنطولوجيا 
واستلهموه إطارًا لجمع المعرفة وتمثيلها بشكل منهجي منظم يمكن الاستفادة منه 
حاسوبيًا. LYN]‏ وقد تواكب هذا الاستلهام مع انتهاء باحثي الذكاء الاصطناعي إلى أن 
(Algorithms) «dy | obj I db‏ الحاذقة (ومن أمثلة هذه الخوارزمات 


-$ هنا pi li o‏ الحاسوبي هو عبارة عن الوصف الرياضي المفصل للخطوات الحاسوبية التي يؤدي تنفيذها 
لحل إحدى المسائل الرياضية العامة. 


—\Ao- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
$5 ييا 


«أساليب البحث Y (Tree Search Methods A pot‏ تكفى 5 was‏ لحل المسائل 
الواقعية الجادة» بل لا بد كذلك من مزاوجتها بقاعدة معرفية حسنة التمثيل للمسألة 
المطلوب التعامل معهاء وبذلك ol‏ خوارزمات المعالجة الحاسوبية الحاذقة بالتزاوج 
مع القواعد المعرفية المحوسّبة (الأنطولوجيات) تشكلان القدمين اللتين يمشي Legale‏ 
مقاربتها عن الذكاء البشري. 

ومع وجود بعض الاختلافات الفرعية بين الباحثين والمشتغلين بعلوم الحاسب فيا 
يتعلق بالبتى الأنطو لو جيةء فإن هناك le GU‏ على OLS fo‏ أساسية ÉS‏ الأنطولوجيا؛ 
ومن al‏ 


الموجودات/ الكائنات وأفراد هذه الموجودات J‏ 


. الئئات/ الأنواع» وتصنيف الموجودات تحت هذه الفئات. 
. العلاقات بين الموجودات (وكذلك العلاقات بين أفرادها). 
. خصائصٌ الفئات (والموجودات تحتها). 


. الأحداث؛ حيث يشير الحدث إلى تغير في خصائص الأفراد و/ أو الموجودات 


الوظائف؛ وهي التي تسمح بتكوين بتّى مركبة من الأفراد يمكن التعامل معها 
لاحقا كوحدات أنطولوجية. 


. القيود؛ وتوضع على ما يمكن قبوله CIES‏ من صيغ تقريرية UL‏ 


الأنطولوجيا أو جزء منها. 


. القواعد (الشرطية We‏ - في شكل مقدمات ونتائج) التي تصف الاستدلال 


المنطقي الذي يمكن استشفافه من مجموعة الصيغ التقريرية المقبولة. 


. المسلمات. 


jl 


b 


١-«الإنسان»‏ كائن؛ أما الشخص ged‏ «فلان بن فلان بن فلان» على سبيل المثال فهو 2 من أفراد هذا الكائن» و«الشارع» 
كائن؛ أما شارع «الشانزلزية» ني باريس عاصمة فرنسا على سبيل المثال فهو فرد من أفراد هذا الكائن» ... إلخ. 


=A- 


وفي حين أن المركبات المذكورة أعلاه من «أ) إلى 09 هى HLÉ‏ ثابتة (استاتيكيّة) 
في زمن التشغيل» فإن المركبات «ها مع (و) ع يكنات GaU) sew‏ في زمن 
التشغيل» كا أن المركبات من «ز» إلى «ط» هي مركبات استاتيكية Age‏ الأرضية 
لديناميكية الأنطولوجيا. 

Lens‏ يشيع E E‏ بناء وتوظيف أنطولوجيات على درجة عالية من التفصيل في عدد 
من المجالات الحاسوبية المتقدمة - ومن أمثلة ذلك؛ المحاكاة والألعاب - إلى الحد الذي 
يعتبر معه البعض «هندسة الأنطولوجيات» فرعًا (GU‏ بذاته من «هندسة المعرفة» OP c‏ 
حقل حوسبة اللغات الحية يولي Gheal‏ خاضًا بالأنطولوجيا. 

وقد نشأ الاهتمام ESH‏ من قبل الباحثين في Sle‏ معالجة اللغات الحية بالأنطولوجيا 
على أساس أنها تستطيع تشكيل الإطار الرابط بين الطبقات الأولية ALLL‏ اللغة الحية؛ 
كالتحليل Cali Gall‏ والصرئّ (المورْفُولُوجيَ) على سبيل المثال» وبين 
الطبقات العليا ALLL‏ اللغة؛ مثل «الترابط الخطابي) (Discourse Integration)‏ ومعرفة 
«المغزى السياقي (Pragmatics) ASU‏ وهي التي تستلزم AET‏ بواقع العام وتفاعلاته. 
ففي غياب إطار معرفي يربط مفردات اللغة وقواعدها الشكلية مع حقائق ووقائع العام 
الذي تعبر عنه o‏ فيه من كائنات وعلاقات بين هذه الكائنات ... إلخ» فإن معالجات اللغة 
الحية تبقى منحصرة في الإطار الشكلي الذي يقتصر على أنواع من المعالجحة الرمزية لا ترتبط 
Jas o‏ عليه هذه الرموز في واقع استخدامها [Y]‏ (سواء كان واقع العام المشترك الجامع 
لعموم البشر» أم كان dle Gilly‏ جزئي متخصص منه» el‏ كان حتى واقعَ dle‏ متخيّل)» 
وعدت يحل هذا الغياب GES‏ من Bo‏ وامعداذ ومردود bes‏ لات أية ee AN‏ 

وعلى ذلك فقد اتجهت حوسبة اللغات الحية منذ ثلاثة عقود أو يزيد إلى اعتماد 
لأنطولوجيا lb]‏ نموذجيًا لجمع وتمثيل المعرفة اللغوية الدلائية بحيث تمر بين ما 
دونها وما فوقها من ALL SEL‏ اللغة الحية. ونظرًا ely OV‏ أنطولوجيا كامالة 
بكل مركباتها - LEM‏ إليها le‏ - وذات محتوى يشمل معرفتنا عن العالم كان 
وما يزال طموحًا شاهقًا يمثل إنجازه مَعْلَا أساسيًا على الطريق الطويلة لحوسبة 
اللغات الحية وتطبيقاتهاء فإنه لم يتم حتى OW‏ بناءٌ Je‏ هذه الأنطولوجيا الكاملة 
الشاملة لأية لغة حية وهناك جدل بين العلماء عما إذا كان في المستطاع إنجاز ذلك في 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


المستقبل المنظور”» وقد أدى ذلك بالعلماء والباحثين العاملين على حوسبة اللغة إلى 
سلوك Use Jos‏ عبر الاستعاضة عن بناء أنطولوجيا شاملة AU‏ ببناء أطر معرفية 
دلالية aU‏ بعدة أشكال ختصرة ة تستلهم روح الأنطولوجيا وتحافظ على بعض أهم 
مركباتها للتمثيل JYI‏ - وخصوصًا تلك المرقمة e‏ من أ إلى د - ويمكننا النظر إلى 
مثل هذه الأطر كأنطولوجيات جزئية سواء من حيث مركّباتها أو محتوياتها. 


Sell SY التحليل‎ - Y 
الجزئية التي استقر بناؤها بنجاح لحوسبة المعرفة‎ icta ONG ad os 
(Lexical Semantics) هي تلك التي تحتوي «الدَّلالات المعجمية)‎ iJY-Ul اللغوية‎ 
كام طبقة المعالحة الدلالية للغة‎ LEY فإن الدّلالات المعجمية‎ LAL وكا يُوجي‎ 
الحية ولكنها فقط تشمل المعالحة الدّلالية لمفرداتها وهی جرد الشريحة الدنيا من هذه‎ 
)... الطبقة» أما المعالحة الدلالية لما فوق ذلك من تراكيب لغوية (عبارات» حمل فقرات‎ 
ما زالت في مراحل‎ Ue SS عبر أنطولوجيات أكثر‎ G pulo فإن محاولات مُقارَبتها‎ 
بين التحليل‎ Uo أبكر بكثير» ويعرض الفصلٌ التالي من الكتاب «معالجة الجملة العربية‎ 

والتوليد» لمحاولاتٍ رائدةٍ لمعالجةٍ اللغة العربية CI‏ في يتجاوز المستوى المعجمي. 

a y‏ المجال في القسم الرابع من هذا الفصل لتأصيل الكيانات الدلالية ا لمْجَّمية 
كأنطولوجيات جزئية وفق العرض الذي قدمناه في القسم السابق (الأول)» فإن ما تبقى 
من هذا القسم (الثاني) يَعْرِض Ey‏ هذه الكيانات والاعتبارات العملية لإنشائهاء كا 
يتعرض القسم التالي (الثالث) لأمثلة من الكيانات الدّلالية المعْجَمية العربية القائمة 
بالفعل وبعض ما يترتب عليها من معالجات دلالية معجّمية 

ونستطيع أن نرسم صورة دقيقة للدّلالات | لاق bÉ‏ 35,25 ها la‏ 
كل مفردات اللغة ببعضها البعض عبر علاقات دلالية» كا يمكن أن ČSS‏ هذه الشبكة 
بنسيج يمْكِن صياغة abet‏ الأسامي على النحو التالي: 


-١‏ يحتاج إنجاز مثل هذه الأنطولوجيا الكاملة الشاملة موارد بشرية وإداريةَ وحاسوبية ومالية هائلة» ولا يعتقد أنه من الممكن 
إنجاز مشروع كهذا في زمن مقبول دون تعاون على مستوى Me‏ - مثل ما esl‏ في مشروع «الجينوم Genome‏ - ونرجو 
أن تبادر إحدى المنظمات الإقليمية أو الدولية في أقرب وقت إلى القيام على التوعية بأهميته ومن نّم الترويج لتمويله وتنفيذه. 
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R J 
كنا‎ > W, فک ف‎ 


أي أن المفرّدة ف, ترتبط بالعلاقة ل مع المفرّدة (أو المغرّدات) ف, 


وبمعرفة ذلك JET‏ تلخيصٌ Bley‏ الوظيفة الأساسية للمعالجة IVI‏ 
المعجّمية في إيجاد الإجابات الصحيحة على السؤالين التاليين: 
أ. بمعرفة مُفْرَدتِينَ؛ ما هي العلاقة الدّلالية التي تربطهما؟ أي أنَّ ف١‏ مع ف۲ 
معلومتان والمطلوب هو الحصول على ل. 
ب. بمعرفة مُفْرَّدة وعلاقة دلالية؛ ما هى المفردات التى ترتبط مبذه المفردة الأول RE‏ 
oe EE‏ 
aoe‏ إذن js‏ من g ae‏ و «العلاقات ud‏ الكزنين الرئيسيين 
dus‏ بإسهاب في باب oe Js di me‏ اللغة العربية») or rem‏ 
ee cual in allia ee t p‏ 
SS E‏ = ع نوعا 
ty TEMPE EET‏ المفردات 
وعددها = م - ١‏ عبر إحدى العلاقات الدلالية وعددها 24 de‏ ذلك Ka‏ 
حسابٌ عدد الحالات التي يجب على الفريق فحصّها ونرمز له بالحرف ن وفق الصيغة: 
One‏ ريه 
N,-M:(M-I): L&M?:L‏ 


حيث أن م Bole‏ ما تكون عددًا كبيرًا Uer‏ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


2 
A 


وهذه الصيغة Ai‏ عن WS‏ فادحة يكاد يستحيل il, bun‏ ولتوضيح 
ذلك نفترض على سبيل المثال عملية بناء شبكة دلالاات معجّمية oiy‏ الطريقة المباشرة 
کی تخطى da‏ آلف مفردة كن أن uat‏ ون an n‏ عشرون dV) Boe‏ 
فتكون التكلفة إذن حوالي مئتي مليار حالة فحص (أي OLI‏ وأمامها أحد عشر صفرًا)» 
وبافتراض قدرة اللغوي عل دراسة ألف حالة خلال الساعة فإن عدد ساعات العمل 
المطلوبة يبلغ te‏ مليون dele‏ عمل وهو ما يجاوز مئة call‏ سنة عمل من فرد واحد! 

ولتجاوز هذه التكلفة الباهظة يجري استدعاء مفهوم Xo‏ وسيط يسمى في بعض 
الأحيان «فئة الترادف» أو «الحقل (GYAN‏ أو «الَعْنَى HA‏ وهو ببساطة معنى أساسي 
dele‏ اللغة مثل Uo SSI) 5 (CA)‏ »العمل ( » «النجاح» c‏ «الفشل» e‏ «الصواب» .. 
إلخ» وتندرج تحت كل معنى IS‏ من هذه المعاني العديدٌ من الكلمات المترادفة؛ وكمثال 
على ذلك نأخذ معنى «التأليف» Authoring)‏ الذي يمكن أن مدو lds ad‏ مثل 
tbs}‏ 5 «كتابة») 5 e (a >) le d «(o ha TENET 5 Gi TED‏ 
tis, bh‏ » الرسالة) OL‏ مع ضرورة التنبيه إلى أن نفس الكلمة قد تندرج CF‏ 
أكثر من duly ES ae‏ وذلك مثل كلمة Re‏ التي قد GU‏ بمعنى pe)‏ الإبصار» 
أو tcI»‏ أو «الجاسوس» أو «العقار» . e-‏ . ونفترض أن المعاني الكلية التي نعتمدها 


وبجانب استدعاء هذا المفهوم JYI‏ الوسيط c‏ افتراضًا د Gls Ga a OIN»‏ 
مفاده أن العلاقة EYII‏ بين أيّ كلمة مندرجة تحت أي معنى (el, D C‏ كلمةٍ 
مندرجة تحت أي معنى CS‏ «(ب» هى IE‏ العلاقة TERRAE‏ المعنى الكلى e‏ 


والمعنى الكلي «(ب». 


-١‏ لا un‏ | على فطنة القارئ العربي أنه لا تكاد توجد كلمتان عربيتان متساويتان 9 HIV‏ فعلى سبيل SUM‏ عند مقارنة كلمة 
0559 بكلمة «مقت» Bay‏ يتضح أن درجة BALI‏ في الصفة الثانية أشدٌ من الأولى - قال تعالى L‏ أا الذين آمنوا 1 
تقولون ما لا تفعلون. 25 Cs‏ عند الله أن تقولوا ما لا تفعلون Y Y CAE‏ وعند قَحْص دلالة 1 € بالمقارنة 
مع اَعَد نجد أن فِمْل الجلوس لا يأتيه إلا الشخص القائم/ الواقف se‏ لا يلزم ذلك في فعل القعود - قال الشاعر 
أبو واس ED‏ بكي eode‏ رَس : :: قاتا ما 25 لو كان CE‏ ... إلخ. وعلى ذلك op‏ أغلب اللغويين يرون 
أن الترادف بين كلمتين يعني Clee‏ شدة التقارب الدّلالي بينهما وليس التساويّ التام. 


-19:6- 


ولإقامة شبكة الدّلالات المعْجّمية «التقريبية» عبر هذا المفهوم الدلالي الوسيط فإن 
علينا توفير فريق لغوي SF FIN‏ مفردة من بين فئة colo ill‏ (وحجمها م مفردة) 
ويبحث وقوعّها تحت كل معني US‏ من فئة المعاني الكلية (وحجمها ح (ÉS fae‏ 
إضافة إلى دراسة احتمال اتصال كل معنى US‏ بباقي المعاني الكلية وعددها - ح - ١‏ عبر 
إحدى العلاقات الدلالية وعددها = £« وعلى ذلك lie Ss‏ عدد الحالات التي 
يجب على الفريق فحصها ونرمز VOGAL‏ وفق الصيغة: 


داه نه دك يه ب ونوك انك يه 
N,-M-S*S-(S-I)-L&M-S* 521‏ 


وهذه الصيغة AS‏ عن تكلفة أقل بكثير من الأولى بافتراض نفس عدد المفردات 
ونفس عدد العلاقات IVI‏ ومع افتراض عددٍ من GLU‏ الكلية يساوي BT‏ على 
سبيل المثال تكون التكلفة إذن حوالي مئة وعشرين مليون حالة فحص وهو ما يكافئ 
ثلاثة وستين سنة عمل من فرد واحد وذلك أقل من التكلفة الأولى بنسبة تقارب 
ألف وستمئة وستة وستين مرةً. 

ومن الجدير SUL‏ أن الوعاء اللغوي الذي تندرج فيه مفردات اللغة في ple gast‏ 
تحت معان كلية ier Gls IRE‏ كرف لدا باسم )256( (Thesaurus)‏ ومن 
بين المكانز العربية à dl‏ تلك المراجع المشار إليها فى نباية هذا الكتاب cE oF] eli b‏ 
[Y ١ Aa‏ وتعتبر هذه SSU‏ وأمثاها نقطة انطلاق لا E‏ عنها لبناء أية شبكةٍ 
RSS IY‏ غرية لعل را 


Ul‏ العلاقات الدلالية فمنها علاقتان حيويتان لا غنّى gre‏ لبناء أية شبكة دلالية 
RR‏ الأول علاقة «الترادف» وهي التي يرتكز عليها استغلال المفاهيم الدلالية 
الوسيطة كا سيق عر asl, Gallows‏ علاقة «الاشتمالية» وهي علاقة العام بالخاص؛ 


وتتايز إلى علاقة َع من tis- -kind-of‏ مثل علاقة «السرير كنوع من الأثاث» وعلاقة 
PT‏ من Gs-member-of‏ مثل Be‏ «السنجاب كفرد من coL, del‏ القوارض» 


-١‏ أو سنة عمل واحدة من فريق به ثلاثة وستين فردًا يقسم بينهم العمل بالتساوي. 
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هذه الطبعة إهداء من المركز 
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وتكون Be‏ الاشتالية «التصنيف (Taxonomy) (€ 4 Al‏ لشبكة dS!‏ مع 
ملاحظة أن الأفراد لا تكون إلا في آخر مستوى من هذا التصنيف. 

ومن العلاقات الدلالة غاذقات أساسية شهيزة لا يمكن أن cux‏ عن أية شك 
دلالية معجمية : 

أ. علاقة «التضاد» ؛ مثل علاقة معنى LS‏ € كمضاد لمعنى ALLS‏ 

ب. علاقة «السببية» € مثل علاقة معنى «الأكل» كسبب لتحقيق معنى JI‏ 

ج. Be‏ «الشرطية» ؛ مثل علاقة معنى «الزواج» كشرط لوقوع معنى «الطلاق). 

د. علاقة HSL JI Zip‏ مثل Be‏ معنى Geb‏ الذي يمحل في زمن 

«الليل». 

ه. علاقة SVL‏ المكانية» € مثل علاقة «السّمّك» الذي يحل في UD‏ 

و. علاقة «الجزئية» ؛ مثل علاقة )|( كجزء من «الوجه». 

وهناك أيضًا العديد من العلاقات الدلالية التى تعد اشتقاقات تفصيلية لما سبق من 
علاقات دلالية أساسيةء فضلاً عن أن بعض الشبكات الدلالية المعجمية تتضمن أيضًا 
معكوس العلاقات الدلالية المذكورة عاليه؛ ومن ذلك على سبيل “isto‏ الزمانية») 


كمعكوس لعلاقة iu‏ الزمانية» وذلك مثل علاقة «UD‏ كمَحَل ge‏ كما أن 
علاقة rate‏ معكوس لعلاقة «الحرئية» وذلك مثل علاقة «الوجه» «بالأنف).... إلخ. 


ومن الواضح تبعًا لصيغة حساب التكلفة ن" التي اشتققناها le‏ أن تكلفة بناء 
الشبكة الدلالية المعجمية 3 تتزايد باطراد متسارع مع زيادة عدد العللاقات الدلالية ح بين 
مفرداتها. 


ما eus‏ في هذا القسم يتبين لنا أن بناء شبكة AJY a‏ مُْجَّمية ذاتٍ تغطية واسعةٍ لمفردات اللغة 
وللعلاقات UY‏ بينها يتطلب عملاً غزيرًا يقوم به فريقٌ متجانسٌش vl.‏ من اللغويين 
المتمرسين في علوم الدّلالة والصرف Éi‏ والمعاجم. 


-١‏ وهو ما يناظر تصنيف الكائنات في الأنطولوجيا الذي ذكرناه في القسم الأول من هذا الفصلء والذي نعود إليه في 
القسم الرابع من هذا الفصل لتأصيل الشبكات الدلالية المعجمية كأنطولوجيا لغوية جزئية. 
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ALLL -Y‏ الدّلالية المعجَمية في اللغة العربية 
يمكن تصنيف المقارَباتِ xU‏ بناء الشبكات الدلالية المعجمية إلى الطريقتين 
الآتيتين اللتين تؤديان إلى نفس الغاية مع بعض الاختلافات التفصيلية: 

[YV] (WORD NET) (olds! «شبكة‎ Ere! dosi ou B a 
1... JI GYI e seal B ox Set) المترادفات»‎ i فيها‎ aL حيث‎ 
AS مشار إليه في القسم السابق 52 مثلاً تشكيل فئةٍ ترادُفي ما يلي من‎ 
Ga) 3 a) «أستاذ)»‎ IAD » n (ON. مترادفةٍ (متقاربة‎ 
وكا ورد في القسم السابق فإن المفرّدة ذات‎ fall. Gale e 
door الدّلالات المتعددة قد تنتمي لأكثر من فئة مترادفات واحدة» ويتم‎ 
استقراء حصيلة المفردات وربا مع الاستعانة‎ Ho على فئات المترادفات هذه‎ 
الموسّعة كنقطة انطلاق» ونتيجة استقراء المفرّدات في الاتجاه من‎ SII ببعض‎ 
عدد فئات‎ GS أسفل (المفردات) إلى أعلى (فئات المترادفات) فإن هناك ميلاً إلى‎ 
من مثل الأنواع التي وردت في القسم‎ AYSI المترادفات ح. أما العلاقات‎ 
السابق فهي تصل بين فئات المترادفات نيابة عما تتضمنه من مفردات وهذا على‎ 
من الناحية‎ ERE جعل تكلفة بناء شبكة الكلمات‎ bo ESS وجه التقريب» وهو‎ 
Paver] 
في‎ (Princeton Word Net) الإنجليزية»‎ GU! olds وقد بدا تطوير «شبكة‎ 
كأول شبكة دلالات مُعجَّمية حوسَبة تتبع‎ EY Ie ۱۹۸١ جامعة برينستون عام‎ 
ثم توالى منذ ذلك الحين تطويرٌ شبكات الكلرات‎ e CIS أسلوب «شبكة‎ 
Global) لتغطي العديد من لغات العالم تحت مظلة «شبكة الكلمات العالمية»‎ 
عددًا واسعًا من اللغات الحية (والأوروبية‎ OYI التي تضم‎ EY *] (WordNet 
أن منظومة شبكة‎ SUL فيها اللغة العربية. ومن الجدير‎ o منها بصفة خاصة)‎ 
من مشروعَيْ «شبكة‎ JS GREY الكلمات العالمية تعتمد المواصفات والمعايير‎ 
Euro) الكلمات الإنجليزية من برينستون» » و«شبكة الكلمات الأوروبية»‎ 
[Yv] (Word Net 


-Synonyms-Set شائع للاسم الكامل‎ ae هو‎ Syn-Set الاسم الاصطلاحي‎ -١ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n— 15‏ 


od " "Y‏ الثانية فهي SUI LSI‏ المعجّمي عَبْرَ الحقول الدلالية» » حيث 
LZ‏ فيها «الحقل eA LY £] (Semantic Field) «QNI‏ & الدّلايّ الوسيطة 
i [m‏ حقل دلالي أحد المعاني الكلية الأساسية القائمة بذاتها مثل CLAW‏ 
c (SUID «Gaul e pes»‏ «السلاح»» (Gua JD TCU‏ «الطعام» m‏ 
إلخ» ويجري إدراج كل مفردة من مفردات اللغة تحت الحقل الأكثر تعبيرًا عن 
دلالتهاء ويمكن بالطبع أن تقع نفس المفردة ذات GLU‏ المتعددة تحت أكثر من 
حقل دلالي واحد» ومن أجل eU]‏ تسكين كل cola AM‏ تحت الحقول الدّلالية 
فإنه تجري الاستعانة sod‏ الموسّعة. ونظرًا OY‏ إنشاء الشبكة الدّلالية عبر هذه 
الطريقة يتمدد من الأعلى (أي الحقول الدّلالية) إلى الأسفل op cols AUD‏ 
هناك ميلاً إلى تحجيم عدد المفاهيم الدلالية الوسيطة ح. LÍ‏ العلاقات الدّلالية 
فهي تصل بين الحقول IV‏ نيابة عا يقع led‏ من مفردات وهذا أيضًا على 
وجه التقريب» وهو ما يجعل التكلفة الاقتصادية هذه المقارّبة أكثر جاذبية. 

LiB dy ll a سم‎ cp M Ma epa من‎ frill Sle] ger le d] old; 
هذه السطور(١) سوى القليل من الناذج التي يمكن الاعتداد‎ GES نجد حتى تاريخ‎ V 
من حيث تغطية المفرّدات العربية وثراء العلاقات‎ YESI بها ونذكر منها اثنين هما الأكثر‎ 
الذلالية بينها:‎ 

(Arabic Word Net) أما النموذج الأول فهو «شبكة الكلمات العربية»‎ - V. Y 
«شبكة الكلمات». وقد‎ exe. وقد جرى تنفيذه حسب الأسلوب الأول المذكور‎ [TM 
بدأ العمل في شبكة الكلمات العربية عام ألفين وخمسة ميلادية كأحد مشروعات «شبكة‎ 
وقد جرى ابتداءً إنشاء المحتوى المعجّمي‎ «(Global Word Net) (ALLS! الكلمات‎ 
الإإصدارة الثانية لشبكة برينستون‎ os sz لشبكة الكلبات العربية نقلاً (عبر الترجمة) عن‎ 
تسعة آلاف‎ Boe ويضم محتوى شبكة الكلمات العربية‎ V] للكلمات الإنجليزية‎ 
مئة ألف من الأزواج‎ ue Sa عشرين ن ألف مفرّدة (أو تعبيًا‎ dors فئة ترادف‎ 
بعص التحسينات على هذا المحتوى ا معجمي‎ EGAT (مفرّدة» فئة ترادف)» كا‎ xd 
لغوية لتمكين التعامل بمرونة‎ le لتوسعة تغطيته وخصوصًا عبر توظيف أدوات‎ 


١‏ - أي في غضون الفترة ۲۰۱۱م/ ۲٠٠۲م‏ حيث جرى تأليف الطبعة الأولى من هذا الكتاب. 
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مع البنية الصرفية للكلمات العربية”". وربا كانت أهم أوجه النقد التي aS‏ لشبكة 
E‏ ع Ore M Ld.‏ 
Msc inii. E aes Awan eae‏ 
العربية ما زال يعتبرها على طريق طويل من التطوير والتحسين''' op‏ هذا العمل يبقى 
ذا قيمة معتبّرة خاصة وأنه متاح بشكل مفتوح المصدر للجميع. 

Ul, -YY‏ النموذج ZV‏ فهو «قواعد بيانات الدّلالات المعجّمية العربية عبر 
الحقول الدّلالية» (Arabic Lexical Semantics Database via Semantic Fields)‏ 
Cue oat coe Gilly [10]‏ الا سوت igue 554M GUI‏ اال بط AYU‏ 
المعجّمي عَبْرَ الحقول الدّلالية» بواسطة «الشركة الهندسية لتطوير eli‏ الحاسبات =F)‏ 
دِي-آيْ)) (RDI; www.RDl-eg.com)‏ التى عكفت على بناء وتطوير هذه الشبكة 
الدلالية المعجمية العربية بين منتصف عام ۵٠٠۲م‏ حتى بداية عام ١1١7م‏ بدعم 
وتهقويل o^ d‏ «مركز تيز التنقيب المعلوماتي والنمذجة الحاسوبية / / http:‏ 
(dmem.cu.edu.eg‏ بمصر بين بداية عام 5 ١٠١٠م‏ إلى بداية عام [Y£]eY* V‏ وقد 
مر العمل عبر هذه السنوات بثلاث مراحل» حيث امتد الإنجازٌ مع eU]‏ المرحلة الثالثة 
في بداية عام ١٠٠۲م‏ ليشمل نحو مئة آلف مفردة عربية صريحة تندرج تحت مستويين 
من الحقول الدلالية؛ مستوّى أسامييٌ عام به نحو ألفين من المعاني والمفاهيم AAS‏ 
is Ce pl eo gud)‏ يتتشعب إلى ia dm‏ عشر WT‏ وأربعمئة ssi dio im‏ تفصيلاً 
لتصنيف gu‏ الكلية Gs‏ الصيغ الصرفية” "© ووفق بعض Oasys oinal‏ 


(Tim Buckwalter الصرفي العربي 459 باكْوُولْرَ‎ fi توظَّف شبكة الكلمات العربية الآن‎ -١ 
وذلك لربط‎ http:/Avww.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogld=LDC2002L49 
الاستعلام عنها لايا بالحصيلة المحدودة الواردة على نحو‎ Ube حصيلة واسعة من الكلمات العربية الخام التي قد‎ 
الآلي للمفردات العربية» من هذا الكتاب).‎ pall صريح في الشبكة (راجع فصل «التحليل‎ 

. http://www. vossen.info/docs/2008/Arabic WordNet-GWN2008-final. pdf انظر‎ -Y 

Y‏ هذه الأصناف الصرفية الأربعة عشر هي [اسم آلة» اسم تفضيل» اسم ذات» اسم زمان» اسم فاعل» اسم معنى» 
اسم مفعول» اسم مكان» اسم منسوب» صفة A‏ صيغة (Je GATA‏ كلمة وظيفية» مَصْدَر) . 

5 - هذه التصنيفات الدّلالية هي fre ds}‏ « فاعل» مفعول» dive‏ مشبّهة» تفضيلء ذات» مكانء زمان» كلمة 
ID‏ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


وترتبط هذه الحقولٌ الدّلالية بعضّها ببعض عبر عشرين نوعًا ما أشرنا إليه من 
علاقات دلالية في نهاية القسم السابق سواء أكانت علاقات أساسية pl‏ مشتقة أم 
معكوسات هذه وتلك» وتتحكم التصنيفات الصرفية والدّلالية للحقول الدّلالية في 
المستوى الثانوي فيا ينطبق وما لا ينطبق بينها من علاقات دلالية؛ فعلى سبيل المثال 
لا تقوم علاقة LL‏ الزمانية إلا بين حدث ورمن ونتيجةً لذلك فإن قيمة ح المَعّالة 
المستخدّمة في حساب تكلفة إنشاء الشبكة الدّلالية هي ألفان وليست ثانية عشر ألف 
وأربعمئة. وني محصلة ذلك كله فإن لدينا في نسيج الشبكة أكثر من مئتين وثلاثة وتسعين 
ألفَ وصلة دلالية تربط الحقول الدّلالية بعضّها ببعض 

ومن الحدير of SUL‏ اة آلف مفردة المندرجة في قاعدة بيانات الربط الدلالي 
العجمي هذه ليست جرد كلمات عربية ly le‏ هي AES‏ صرفية مرنة Fe‏ کل 
منها عددًا كبا من SINS‏ النهائية المكوّنة من pols‏ هذه OLS LI‏ مع اللواصق؛ 
مثل Kan‏ التي Ez‏ أيضًا [المكتب» لمكتبه» فالمكتبان» مكتبناء بمكتبي» c‏ وذلك 
تحت bti an > "n‏ ضمن نفس دلالتها و تستخدم J‏ -ڍي-آيٰ هذا الغر ض أدواتها 
للتحليل الصرفي والعنونة النحوية £1[ وعلى ذلك فإن هذه المئة آلف من المفردات 
تغطي Dd‏ عشرات الملايين من الكلمات العربية النهائية مما يؤشر على مراعاة طبيعة بنية 
اللغة العربية في تصميم هذه الشبكة الدّلالية المعجّمية. وقد كانت BIG‏ إنشاء محتوى هذه 
الشبكة الدّلالية هي Sdn‏ الكبير» [4 ] وهو عمل e‏ أنجزه فريق كبير من الباحثين تحت 
قيادة عالم اللغة الشهير الراحل «أ.د. أحمد ختار عمر» لرصد الحقول الدّلالية الأساسية في 
اللغة وإدراج المفردات العربية تحتهاء ثم Cod‏ بعين الاعتبار Sae‏ مصادر أخرى led‏ بعد 
عند تنقيح محتوى الشبكة الدّلالية [VY Y N ۹۸۷ OY]‏ فضلاً عن الاستفادة 
من «شبكة الكليات العربية» (Arabic Word Net)‏ السالف ذكرها. 


P 2‏ ف 4 P‏ 
4 - شبكات الدّلالات المعْجمية كإطار أنطولوجيٌ جزئى 
Lite‏ الآن تأصيلٌ الشبكات الدّلالية المعْجّمية - سواء لعبت فئات الترادف أم 
الحقول الدّلالية 555 المفاهيم ADVI‏ الوسيطة فيها - كأنطولوجيات جزئية وفق 
العرض الذي قدمناه في القسم الأول من هذا الفصل» وذلك بالترتيب على النحو التالي: 


eX de 


أ. كائنات الأنطولوجيا WS al‏ تناظرٌها المفردات في الشبكة AJY‏ 

ب. الفئاث/ الأنواعٌ في الأنطولوجيا WBS‏ في الشبكة الدّلالية المفاهيمٌ الدلالية 
الؤسيطة - سواء أكانت cot‏ ترادف أو حقولاً ولالية - ى) أن التصنيف 
الحرمي هذه الفئات في الأنطولوجيا تمثلّه في الشبكة الدّلالية علاقة الاشتهال. 

ج. العلاقات بين كائنات الأنطولوجيا YII BAJI Ga bus‏ بين المفاهيم 
ASV GU‏ الوسيطةك cols ol ps‏ فاك تراد ار جل AJ‏ وا 
ما يندرج تحتها من مفرداتٍ وهو التقريبٌ الدلالي العمل الذي ذكرناه. 

د. خصائصٌ الفئات/ الأنواع والكائناتٍ تحتها في الأنطولوجيا DEUS‏ الخصائص 
الصرفية والدّلالية (المذكورة في الملحوظتين الهامشيتين رقم ١١‏ و CLE ٠١‏ 
التى تؤدي لتفصيل الحقول الدلالية الأساسية إلى حقول دلالية ثانوية. 

ومن BENI‏ أن عناصرٌ الأنطولوجيا الحاضرةً في الشبكات الدّلالية المعجمية هى 

Alb‏ امكو نات القافة اا ها Cais‏ هه pole‏ الألطر len gh‏ ن كوبا 


أنطولوجية متحركة (ديناميكيّة) إضافة إلى تلك التي تمثل حقائقٌ العام الخارجي 
العامة المعلومةً خارج إطار النص لكنها حاكمة لفهمنا SVU‏ له» وما ل ed‏ الأبحاث 
ode Fleas} SL Siz,‏ الكر Of TSI Le Shi coU‏ الطزيق dg M‏ 


طويلة نحو تجاوز المستوى المعجّمي في التحليل SVU‏ لِلغة الحية. 


ه- الالتباس الدّلالي والعمل على إزالته 

d‏ التحليل enl CIAM‏ لكل كلمة = بصفةٍ dale‏ - عدةً أجوبة BSE‏ وهو ما 
ف باسم «الالتباس gyi‏ المعجّمي) «(Lexical Semantic Ambiguity)‏ ويرجع 
هذا الالتباس إلى تعدد المعاني الكلية للمفرّدة الواحدة مما يؤدي إلى تعدّد الحقول الدّلالية 
التي تندرح تحتها (أو فئات الترادف التي تنتمي إليها) هذه المفردة؛ فعلى سبيل المثال 
She‏ المعاني الكلية للكلات العربية C (ye)‏ » «(هجاء) » C AD‏ > )26( على 
النحو التالي بالترتيب Gola! pas}‏ جاسوس» عَقار» ذات T‏ ...) 9 
BS‏ فاخ BLP CL ante‏ تكوين الكلمات من الحروف» ٠)...‏ (مؤسّسة مالية» 
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إنفاق المال» مَهْرّب» ...)» إحقبة زمنيةء أحد أوقات اليوم ...). Sky‏ مسألةٌ افك 
الالتباس الالال للكلات» (Word Sense Disambiguation)‏ إحدى المسائل العتيدة 
العنيدة ة التي لم يتم ntn‏ بشكل مرضي سواء في اللغة العربية أم في سواها. EN‏ 
أثمر تطبيق أساليب التعلّم الحاسوبي لفك الالتباس الصرفي - عَبْرَ ترجيح التحليل ذي 
الاحتمال الرياضي الأعلى ضمن سياق التحليلات الصرفية الممكنة للنص المحيط Oy‏ 
عو مدا للك عا بویا إلى حرس By‏ کی لسا ssl‏ التطبيقات المرتكزة 
على هذا النوع من التحليل» فإن هامش الخطأ الناتج A‏ استخدام نفس الأساليب لفك 
الالتباس الدلالي للكلمات أوسع كثيرًا من ذلك حيث لم يقل في أمثل الأحوال مع اللغة 
الإنجليزية عن خمسة وعشرين في BU‏ وقد يرتفع إلى ما فوق الثلاثين في المئة مع اللغة 
Piu al‏ وهو ما يعرقل أداءً التطبيقات المرتكزة على التحليل الدلالي dell‏ - 
بعضًا منها على الأقل - مما سنأتي على ذكره في القسم التالي من هذا الفصل Y,‏ 
REST‏ 2 اتساع i‏ الخطأ في G6‏ الالتباس AYA‏ للكلمات edil ae‏ 
التعلّم الحاسوبي تقارنة ies s‏ نفس الأساليب مع مسألة ÉÉ‏ الالتباس الصرفي 
بحقيقة بحقيقة أن السياق à OY ee VL‏ النص أكثرٌ اتساعًا في المتوسط من نظيره الصرفي» 
JV» bs 3 "‏ الكلمة ba‏ بالكلات القليلة المجاورة U‏ ولكنها كنبا ما LÀ ss‏ 
بكامل Ps a‏ التي ترد فيها (بل ربا تتأثر كذلك با يتجاوز فقرتها Le‏ هو داخل وما 


-١‏ وذلك كما جرى استعراضّه في نباية القسم الثامن من فصل ١‏ التحليل الصرفي الآلي لمفردات اللغة العربية» في هذا الكتاب. 

؟- حيث KÈ‏ للمحلّلات الصرفية العربية رفيعة الأداء أن تصل ذا Xl‏ للخطأ إلى ما دون الخمسة في TY‏ عند 
التدريب والتقويم على كامل اتساع الفضاء اللغوي» بين يمن أن ينخفض إلى نحو الثلاثة في المئة عند التعامل مع حيز 
ضيق من الفضاء اللغوي» وذلك أيضًا كما جاء 0553 في نباية القسم العاشر من فصل «التحليل الصرفي الآلي لمفردات 
اللغة العربية» في هذا الكتاب. 

VSI أيضًا في هامش خطأ فك الالتباس‎ Jeb ني فك الالتباس الصرني العربي‎ t علينا الانتباه إلى أن هامش‎ -Y 
BUH عدد المفرّدات المذكورة بشكل صريح في أية شبكة للدّلالات امحجّمية (من أجل‎ id للكلمات العربية؛ فنظرًا‎ 
DY. على تكلفة معقولة لبنائها) مقارنة بحجم الحصيلة الكلية للمفرّدات العربيةء فإن الكلمة العربية المطلوب تحايلها تحليلها‎ 
المذكورة صراحة في قاعدة بيانات شبكة الدلالات‎ usta يها إلى إحدى‎ d po Jie ها أن تمر أولاً على‎ LY 
سبق 0353 في القسم الثالث من هذا الفصل).‎ (SD eel 

-٤‏ هذه الكلمة «فقرة» في هذا الموضع ČR Ute‏ على ذلك؛ حيث لا نستطيع تقرير ما إذا كان معناها المقصود هو اجزء 
من النص» أو «جزء من برنامج» أو «حلقة في العمود العظمي للحيوان الفقاري» ... إلخ إلا إذا وسعنا إطار السياق 
المحيط بها لكي يشمل قرائن من كلمات تسبقها بمسافةٍ بعيدةٍ مثل ain‏ € و «بالكلمات» ويشمل كلمات تلحقها بمسافة 
بعيدة مثل «كلمة). 
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هو خارج النص)؛ فإذا كان oS‏ تحقيقٌ هامش خطأ صغيرٍ في عملية فك الالتباس 
الصرفي بدراسة سياق احتمالي ضيق لكل كلمة يمتد لكلمتين أو ÉW‏ ما يسبقها وأخرى 
مثلها ما يلحقهاء GA OB‏ هامش خطأ مقارب لذلك في عملية فك الالتباس AY‏ 
ربا Ele‏ لدراسة نحو عشرة أو عشرين كلمة مما يسبقها وأخرى مثلها ما يلحقهاء وهو 
ما يتجاوز بكر القدرات“الراهئة OX, galt SILL‏ 

وقد تستطيعٌ بعضٌ التطبيقات المرتكزة على التحليل الدّلالي المعجّمي أن تتجاوز 
ذلك المعدل المرتفع للخطأ في فك الالتباس الدلالي آلا عبر استغلال بعض القيود 
الإضافية التي Les‏ عند استدعاء الدّلالات المعجّمية في مثل تلك التطبيقات» ومنها 
على سبيل المثال: 

-١ 0‏ الاستفادةٌ من ضيق النطاق اللغوي للتطبيق RE‏ إنشاء شبكة دلالية مُعْجَمية 
مكرّسة لذات التّطاق اللغوي SAN‏ فيُمكِن مثلاً ias‏ ذلك في تطبيق لاسترجاع 
المعلومات حول «الآفات التي تصيب الحاصلات الزراعية الصيفية في صعيد مصر) 
فالبعدٌ الجغ GI‏ مقيّد بصعيد مصر Ny‏ 8 مقيّد بالزمن المعاصر والموضوعيٌ مقيّدبآفات 
الحاصلات الزراعية الصيفية والأسلوبي igo e DU‏ تقريريٌ» ولذلك OB‏ كلماتٍ مثل 
hi»‏ و GALI‏ و «حرارة» سوف تقتصر معانيها - على الترتيب - في الأنطولوجيا 
التي 255 عليها هذا التطبيق على «نوع من النباتات اللا BE‏ التي تتكاثر لا 
جنسيًا» (مع تراجع plab Sli} Glas‏ بعد امتناع عنه)» ...)) ثم «القسم الأسفل 
من النبات تحت الأرض» (مع تراجع معاني («الأصل)» «السبب» «القاعدة)ء...)) 
ثم «السخونة» (مع تراجع معاني ((شدة العاطفة»» «ا لاس والشغف». «علامة على 
استعداد الآلة للعمل)ء ... RG‏ 

٥‏ ,- الاستفادة من عدم الحاجّة أحيانًا إلى الحصول على GLU‏ الأكثر تفصيلاً 
للكلمات والاكتفاءٌ بالمعاني الأعم ها؛ فقد ALS‏ ذلك مثلاً في تطبيق لتبويب المقالات 
تحت عدد محدود من الأقسام العامة في إحدى المواقع الصحفية الإلكترونية. وفي هذه 


EN 


- 


-١‏ تتضاعف القدراثٌ الحاسوبية المطلوبةٌ لمعالجة سياق dim‏ مع زيادة اتساع هذا السياق وفق نمط ET‏ وليس خطيّاء 
ولذلك فإن الفارق مهولٌ بين القدرات الحاسوبية المطلوبة لدراسة سياق le‏ باتساع aK‏ كلمات وبين سياق 
احتمالي باتساع نحو أربعين كلمة (أو حتى نحو عشرين كلمة). 
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الحالة يُكْتَمَى بتعيين الحقول IV‏ للكليات في المستويات CUI‏ (العامة) من شجرة 
التصنيف SYS)‏ ال فرع البحث في غابة المستويات الدنيا (التفصيلية) من 
هذا التصنيف مما يؤدي في المحصلة إلى التخفيف من درجة الالتباس DVI‏ ومن كه 
تقليل فرص الخطأ في عملية إزالته؛ edges‏ الجدول رقم )1-0( أدناه بعض الأمثلة 


على ذلك: 
| الكلمة ESENTE PSEA‏ 
fF} T‏ الصلاة» مكان أو مبنى مخصّص للصلا t‏ (مكان الصلاة) 
إدراسة الوب والحستات» E «JUI‏ إدراسة العيوب 
الالء أوراق مخصوصة للبيع والشراء] والحسنات» (Jui‏ 
Le} 205‏ يؤكل من طعام» مكان مخصّص لتناول 
Jats} fet Es‏ الطعام) 
ES‏ [الرهبةء الخوف. التوجُس والقلق) )3( 


الجدول 1-0 أمثلة على الحقول الذّلالية التفصيلية والعامة لبعض الكلمات العربية. 
ه, *- الاستفادة في olds‏ مثل Information) (oL hll a!‏ 
(Retrieval‏ من 4 ai e‏ حل البحث Filter Da») TÉS‏ للدّلالات a£‏ 
cus‏ «طلب البحث) (Query)‏ وذلك قبل elei‏ عملية فك الالتباس eu JY»‏ 
‘eel COS‏ بعض الحقولٍ الدّلالية الممكنة هذه الكلمات في شبكة الدّلالات 
لمشجمية ما لا يتوافر d‏ بشكل مترابط في ذلك الجسم ge‏ نما يخفف من درجة 
الالتباس DVI‏ وهو ما يودي بدوره إلى 635 Be‏ عملية فك الالتباس SYS‏ التي E‏ 
ذلك الاستبعاد. 
ويبقى بطبيعة الحال جانبٌ كبيدٌ من التطبيقات الأخرى illl‏ (ما سنأتي على ذكره 
في القسم التالي من هذا الفصل) تحتاج للتعامل مع الفضاء اللغوي باتساع نطاقاته d‏ 
ake‏ الأبعاد ولذلك op‏ ارتفاع معدّل الخطأ في عملية فك الالتباس DVD‏ ينعكس 
على فعالية تلك التطبيقات التي لا مَمَرّ أمامَها سوى الانتظار حتى Gad‏ الأبحاث 
ا جارية لمعالجة اللغة pulo‏ على مستوياتٍ ned‏ تجمع بين توسيع شبكات الدّلالات 
المعجّمية بإضافة مكوّناتٍ مناظرة لبعض العناصر الأنطولوجية الديناميكية LE)‏ جاء في 
القسم الأول في هذا الفصل) إضافة إلى تحليل التركيب النحوي العميق للنص [Y]‏ 


ده ولاب 


وكل هذا بالطبع في إطار من أساليب التعلّم الحاسوبية» وهذا ما ستأتي على ذْكْرِهِ في 
القسم الثامن من هذا الفصل. 


9 4 
-٦‏ تطبيقات di is‏ 5 
NET‏ الدلالي» T ; gil‏ عليه mE‏ من هذه MLL AE eum nnn‏ 
(VII‏ بين كلمتين بأقل عدد من (Links) (212 3I‏ بين الحقلين ofA NUI‏ 
تنتمي إليهما كلتا الكلمتين في «التصنيف الدلالي الحرمي» (Taxonomy)‏ وقد يدخل 
بعص الباحئين أحيانًا في حساب هذه المسافة الدّلالية أوزانًا نسبية هذه الوّصّلات تزيد 
od ertet‏ ودين a cdd‏ ودر geriet artes‏ قدت 


وبمعرفة ذلك HW] EK‏ الضوء فيا يلي على أمثلةٍ dole‏ لتطبيقات ALLS‏ اللغة 
حاسوبيًا التي 5555 على التحليل YII‏ المعجميّ: 


المساعدّة في اختيار التحليل النحوي (الإعراب) السليم من بين VERY‏ 
الغزيرة التي عادة ما تنوالدٌ عند محاولة إجراء التحليل النحوي حاسوبياء وذلك 
ما os‏ ال الشائعة «الإعراتث 2 § (gall‏ التي تختصرٌ الارتباط Spas!‏ 
on JS ow‏ الدّلالة المقصودة للنص وتركيبها النحوي الصحيح؛ فإذا دَرَسَنا 
على سبيل المثال fed!‏ التاللي ... dy‏ الوقت الذي Gls‏ فيه اقتصادات البلدان 
الأفريقية من مشكلات ٠...‏ للمفاضلة بين Glue]‏ كلمة «الأفريقية» إما ad‏ 
Ue ji s‏ لكلمة «اقتصادات» أو نعتا مجرورًا لكلمة «البلدان»» فقد تزجح كفة 
الإعراب الثاني بسبب تفوّق الارتباط OUI‏ المعجّمي بين كلمتي «البلدان» و 
«الأفريقية» (حيث قد تندرج مفرداتٌ مثل T soe ox ufa‏ حقل دلالي 
من قبيل «وحدة جغرافية أو سياسية» بينما قد تندرج مفرداتٌ مثل (أفريقياء 
أفريقية ...)1 تحت حقل دلالي قريب منه من قبيل «منطقة جغرافية») GSE‏ 
ملحوظًا على الارتباط SVU‏ الأضعف بين mu‏ الالال الذي عع ad‏ 
كلمة «اقتصادات» وذلك الذي تنتمي إليه كلمة «الأفريقية). i‏ 
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ب. المساعدة أيضًا في اختيار التحليل الصرني الصحيح من بين الاحتمالات العديدة 
التي عادَةَ ما تتولدٌ عند محاولة إجراء التحليل الصرفي الحاسوبي لكلمة ما؛ فإذا 
Ses 255‏ كلمة «بطين» في النص التالي «... فيتدفق الدم في البطين الأيمن 
من القلب ...2 op‏ الحقول IV‏ التي تقع تحتها SUSI‏ الواقعة في سياقها 
النصي القريب مثل مثل «ip 3 GUD‏ ذاث ارتباطاتٍ دلالية أقوى E‏ الحقل 
الدلالي الذي يقع ad‏ التحليل de) iia» d pall‏ صيغة التصغير que‏ من 
تلك SIV colos NI‏ مع بقية التحليلات الصرفية المحتملة الأخرى مثل 
التحليل (Cada‏ (على صيغة المبالغة فعيل) ومثل التحليل «بطين» SHS)‏ جار 
ومجرور: ب + طين) ... إلخ» وعلى ذلك EE‏ التحليل الصرفي بين 
على غيره من التحليلات الصرفية القياسية المحتملة الأخرى لكلمة «بطين». 

أ. وبنفس منطق التطبيقين السابقين OB‏ دراسة الارتباطات VA‏ المعجمية بين 
كلمات النص الناتج عن تقنيات التعرف الآلي؛ مثل «التعرف gu‏ على الكلام 
المنطوق» أو «القراء الآلية للنص المكتوب» ... إلخ» لها قيمة ثمينة في تقدير 
مدى صحة رجات هذه التقنيات حيث تَكْمُن الفكرة في أن GIE‏ متوسط 
قيمة الارتباط الدّلالي لإحدى الكلمات بها جاوڑها من SOUS‏ سياقها النصي 
تحت المتوسط العام لقيمة هذا الارتباط بشكل كبير قد يؤشّر ae‏ 
على هذه الكلمة؛ فالعينة النصية التالية على سبيل المثال والتى قد 
نظامٌ للتعرف JYI‏ على الكلام المكتوب «... .2 DN‏ لمبدع 
بإسهاماته الابتكارية في المجتمعات الحديثة CL.‏ تحتوي على كلمة «القرد» ذات 
الترابط SY!‏ الضعيف مع باقي كلمات هذه العينة النصية مما يثير BAD‏ 
صحة التعرف عليها ومن ثم الرجوع إلى نظام التعرف الآلي مرة أخرى للبحث 
عن بديل آخر ذي ترابط دلالي قوي le‏ حوله ربا يكون كلمة «الفرد» في المثال 
السابق. 

ج. SS)‏ أيضًا تطبيقٌ نفس المنهج لمراجعة رجات أنظمة الترجمة الآلية» وبصفة 
ile‏ فإن تضمينَ دراسة الارتباط GYD‏ المعجّمي داخل آليات البحث 
والمفاضّلة الاحتالية بين الوحدات اللغوية الممكنة ze‏ توليد النص «المتعرّف 


a لانو‎ 


عليه أو GLA‏ في S‏ من هذه الأنظمة يكون أكثر فعالية من استخدامها 
كمرحلة مراجعة isle‏ بعد توليد ذلك النص» حيث يسمحٌ هذا التضمينٌ 
باستدعاء بدائل أخرى إلى أن يتحققٌ تعظيمُ متوسط الترابط الدلالي بين SUS‏ 
النص المترجَم أو المتعرّف عليه ... إلخ. 

ه. يمكن لأنظمة «التدقيق و التصحيح الإملائي» Spell Checking and)‏ 
(Correction‏ أن تستفيد كذلك من دراسة الارتباط GYM‏ بنفس الطريقة 
لتعيين الكلمات المشتبه في خطئها رغم سلامتها هجائيًا حيث قد يتعذر اكتشاف 
مثل هذا النوع من الأخطاء بأية وسيلة أخرى. 

و. تحسين أداء أنظمة «استرجاع المعلومات النصية» Text Information)‏ 
o (Retrieval‏ فيها وظائف البحث النصى» وذلك عبر فهرسة الأوعية النصية 
تل البحث بالدّلالات المحْجَّمية YUN‏ بدلاً من فهرستها OLS AU‏ الصرفية 
هذه الكلمات من جذور أو C ple‏ ويرجع هذا التحسن إلى أن الفهرسة 
بالدّلالات المحْجَمية قد ترفع كلا المؤشرين Gud‏ يقاس با £l‏ مثل هذه 
الأنظمة وهما: 


PIE‏ الاستدعاء» (Recall)‏ حيث تعمل العلاقات IVA‏ وخصوصًا 
علاقة الترادف على زيادة القدرة على استدعاء الكلمات المشامة ÉN»‏ لكلمات 
طلب البحث حتى لو لم يكن بينها علاقةٌ صرفية؛ فعلى سبيل JEU‏ إذا وردت 
i ls‏ «الأسد» في طلب البحث فإننا js‏ نتيجة الفهرسة الدلالية على 
ols‏ من قبيل (اللَيْثْء BLAD ]... cu EA ASI‏ بالطبع إلى «الأسد» 
ومشتقاتها) Le NIS fas‏ النصية محل البحثء وهذا ASL‏ يتجاوزٌ 
NAD Lass‏ ا دعا 


-١‏ وذلك كما ورد في الفقرة أ من القسم السادس من فصل «التحليل الصرفي الآلي لمفردات اللغة العربية» في هذا 
الكتاب. 

-Y‏ يعرف «مؤشر الاستدعاء» És‏ بالإشارة إلى «طلب (Sou‏ ما في قاعدة بيانات على أنه خارج قسمة «عدد المعلومات 
المستدعاة - ضمن كامل فئة المعلومات المستدعاة - التى e‏ استجاباتِ صحيحة لطلب البحث» على «عدد كل 
المعلومات التي تعتبر استجابات صحيحة لطلب البحث في كامل قاعدة البيانات محل البحث». 
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2 
A 


(1)(Precision) ŠÍ Égo 2‏ حيث يجري استبعادٌ الكلمات البعيدة Yo‏ 
عن US‏ طلب البحث حتى مع وجود تشابه بنائي (صرفي)؛ فعلى سبيل 
JA‏ إذا وردت كلمة «عَبّن» في طلب البحث بمعنى «مصدر جوفي للمياه 
Op‏ الفهرسة الدّلالية للأوعية النصية محل البحث تؤدي إلى استبعاد OS‏ 
متشابهة G o‏ من قبيل HET}‏ عيون (بمعنى جواسيس». uie‏ ...1 مما 
قد يرد في هذه الأوعية» ea‏ تؤدي في الوقت نفسه إلى الحصول على IS‏ 
من قبيل Oeo XR qi‏ (بمعنى ينابيع)» os‏ ينابيع ...] مما قد رذني 
الأوعية النصية E‏ البحث. 

of oA |S 5‏ و دعل أن العطيل الذلكل المج Bybee‏ اول اسا تبهو 

aL Lal!‏ الد لال العميقة و اللمفدة UT‏ كانت BET‏ الشخدمة فيها: 

وفي حين أن القائمة السابقة قد تتسع للمزيد من تطبيقات التحليل DVI‏ المعجّمي» 
OF‏ الملمح الواضح المشترك بينها هو احتياجها جميعًا لدرجة مقبولة من الدقة في فك 
الالتباس الدّلالي المعْجَمي وهو التحدي الذي لم تتغلب عليه JU‏ المعالجة الحاسوبية 


+ 


-١‏ يعرف «مؤشر الدقة» bes‏ بالإشارة إلى «طلب (ou‏ ما في قاعدة بيانات على أنه خارج قسمة «عدد المعلومات 
المستدعاة - ضمن كامل فئة المعلومات المستدعاة - التى feat‏ استجاباتِ صحيحة لطلب البحث» على «عدد كل 
المعلومات المستدعاة في فئة المعلومات المستدعاة». 


ع ولاب 


۷- العَُونة الدّلالية Laeli‏ للمدوَّنات النصية العربية 


X8 " ] e برنامج‎ en wy عرفر‎ Jd بحت‎  ريرخلا‎ lal loda € | 
الورقيم نوع المورفيم‎ cun | ئ‎ E: 1 ut [: € HI | 

v الور اساي‎ | > : d E T ELIS ELLE » EYBE 

dam 2‏ وسيلة اساسية لتبادل الخشارات بين الشعوب علي E.‏ م رار ولدور ud‏ 
"IU‏ المي » T A‏ 


d af‏ منتظمة | d yaa‏ متنظمة | R$ una Le‏ منتظمة 


676: by al 


الشّكل ه-١‏ : لقطة من أداة عنونة النص العربي صوتيًا وصرفيًا ead Yas‏ ويلاحظ أن 
اختيار الحقل SYS‏ الأنسب للكلمة ١‏ مرا يجري بعد حسم تحليلها الصرني. 

S y‏ الالتباس DY‏ المعجّمي كأمر gu;‏ في أية شبكة CNN»‏ مُعجّمية» وتحتاح 
تطبيقات التحليل SU‏ المعجّمي كما ورد في القسم السابق من هذا الفصل إلى فك 
هذا الالتباس» ولا غِتى في الوقت الراهن عن الاستعانة بأساليب التعلّم الحاسوبي لفك 
هذا الالتباس» وتحتاج de‏ هذه الأساليب بدورها إلى موارد لغوية كي تتدرب عليها 

ues gius S,‏ الاحتالية الرياضية» وتتكوّن هذه الموارة في حالتنا هذه من 
نصوص 352 لكل كلمة فيها YUN Jatt‏ (أو as‏ الترادف) الأنسب هاء dy‏ 
pu.‏ هذه الموارد بعملية «العنونة الدلالية المعجّمية» للمدوّنات النصية التى ينطبق 
عليها ما ورد في القسم التاسع من باب «التحليل الصرفي JYI‏ للمفردات العربية» في 
هذا الكتاب. وبالإضافة إلى ذلك ينبغي الانتباه إلى النقاط التالية: 


-١‏ تحتوي الورقة المشار إليها برقم GENET‏ قائمة مراجع هذا الكتاب على تفاصيل هذه الأداة التفاعلية. 


-Yro- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ييا 


* لا تجري عملية العنونة QU‏ المعجَّمية إلا على Ge‏ جرى حسمٌ التحليل الصرني 
لكلماته (وتحددت أيضًا «أنواعها الكلامية (POS tags‏ )» ويعرض الشكل رقم 1 أعلاه 
لقطة أثناء تشغيل إحدى أدوات عنونة النصوص العربية التي تدعمٌ كل هذه العَنْوّنات. 

* يقوم اللغويون المؤمّلون ole‏ العنونة الدّلالية المعجّمية ye pail‏ وأحد المؤهلات 
المطلوبة هي AUY‏ بقدر معقول من المعرفة عن موضوع المدوَّنةٍ المطلوب عنونتها. 

* يوجَدُ هامش اختلافٍ طبيعي بين اللغويين القائمين بالعنونة الدّلالية أو بتقويم أداء أي 
ت الع ا ا ل ا 
de‏ بالرأي الغالب لفريق يتكون من عددٍ فردي من المعنونين. 


"cu ما بعد المستوى‎ SYN التحليل‎ -A 

كما ألمحنا في نهاية القسم الخامس من هذا الفصلء فإن الأعمال البحثية جارية لمعالحة 
Io GU‏ فيي يتجاوز المستوى المعجّمي وهي تتوجه عمومًا نحو الجمع بين توسيع 
شبكات الدّلالات المعجّمية بإضافة مكوّناتٍ مناظِرةٍ لبعض العناصر الأنطولوجية 
الديناميكية (ما جاء في القسم الأول في هذا الفصل) وتحليل التركيب النحوي العميق 
للنص» PA‏ في إطار من أساليب التعلم الحاسوبية ANY]‏ 

ولا az‏ أهمية دراسة التحليل الدّلالي العميق على السعي نحو تحقيق الأهداف 
og SUI dees eel‏ لسو ALLS‏ الخامنوية LAU‏ اة يمك Seal oye‏ اللات 
لناصية اللغة gd‏ وتوليدًا بمستوى يقترب (ولو جزتيًا) من المستوى PS peal‏ بل إن 
هذه BEM LAV‏ من HE Fo PAKE y dito‏ كذلك من أجل رفع أداء العديد والعديد من 
التطبيقات الأساسية المرتكزة على التحليل eee DY‏ (من مثل تلك المذكورة في 
القسم السادس من هذا الفصل) إلى مستوى LES,‏ في مصاف التقنيات الحاسوبية التي 


vos‏ عي 


يعتمد عليها. 


5 Á سوف تتفوق على البشر بكونما تتوفر على قدراتٍ هائلة‎ lel وإِنْ تحققت مثل تلك القدراث اللغوية للآلات‎ -١ 
ومُعاجَةٍ أوعية شاسعة الاتساع باذخة الغنى من المعلومات والمعرفة.‎ 


ع وطلاب 


وضمن هذا الإطار تقع «لغةٌ الشبكات LIV‏ الحاسوبية 
العالمليبة) Universal Networking Language)‏ - التى ae‏ أيضًا بالاختصار 
(UNL)‏ - في موقع Goby‏ بين جهود الحوسبة الدّلالية BAU‏ فيها oes‏ المستوى 
dy pole dah cay LTV] cafe‏ حك Leo ae‏ عا فل UL‏ ال اة 
Load‏ ون uo pad‏ اللقاك die filha dos ES ib p os AAI‏ 
الآلية بين أزواج اللغات المختلفة» وكذلك dels‏ للتمثيل المعرفي العام تستفيدُ منها على 
سبيل المثال أنظمة استرجاع المعلومات. 

وقد coU‏ هذه اللغة عام 447١م‏ في معهد الدراسات المتقدمة بجامعة الأمم المتحدة 
في «طوكيو باليابان» وتم النشرٌ عنها لأول مرة عام 82A‏ ويَسْتَمِرٌ d bli‏ 
ذلك الحين عبر شبكة عالمية واسعة النطاق من الباحثين والمطوّرين» Eb EENS‏ لذلك 
مؤسّسةٌ Sb‏ هادفةٍ للربح تحت اسم (UNDL)‏ وهي مُشْهَرة ي eek‏ في 
عام ١٠٠۲م‏ للقيام على هذا المشروع العملاق؛ وتعلن هذه المؤسسة أن هذا العمل Sls‏ 
للأمم المتحدة ما يعني أنه Elle‏ لعموم البشرية. 

ot salads‏ الدّلالية الحاسوبية العالمية» مثالاًعميقًا ومفضّلاً في اتجاه التمثيل 
المعرني اللغوي البشري المشترك المستقل عن خصوصياتٍ WS‏ حية» حيث جرى 
تصميمٌ طبقات ومكونات هذه اللغة بالتناظر مع العناصر الرئيسية في اللغة الحية من 
مفرّداتِ ونحو وأنطولوجيا ولكن بصورة حيادية". وقد أنجز هذا المشروعٌ Brea‏ 
بنيته الأساسية عبر السنين الماضية بواسطة جهود مئتي باحث مُكَرّس لذلك فضلاً عن 
الآلاف غيرهم عق Otley‏ 35 05 حول هذا المشروع عبر de‏ الأرضء وما 
زال المشروع (GB‏ على تحسين هذه البنية التحتية كا لا يزال يواصل إنجاز الجسور بين 
اللغات AA‏ الكبرى (ومنها العربية) إلى هذه اللغة الحيادية. 

ولا تزال هناك تحديات أساسية تواجه هذا المشروع؛ منها على سبيل المثال الالتباس 
الكبير على عدة مستويات لغوية أثناء النقل من أية BS‏ حية إلى لغة الشبكات الدلالية 
الحاسوبية العالمية (الحيادية)» ومنها LAÍ‏ قصورٌ قدرات هذه اللغة الحيادية عن التعبير 
بشكل كامل عن co VUE‏ والمقصودات العميقة لعبارات النصوص في لغاتها الأصلية! 


-١‏ مع مراعاة استبعاد عناصر الالتباس الكامنة في اللغات الحية من هذه التصميمات. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):َُ6ا ب ييا 


كا يقع في هذا الإطار مشروعٌ آخر تحت اسم 7 $ (OntoNotes) (S‏ 
3" لكنه على جانب بناء الموارد اللغوية اللازمة لتدريب الأنظمة «المرتقبة Gs‏ للمعالحة 
الخاسوية LIV‏ العميقة للّخة E‏ ع العنونة talet às gourd LIVIN‏ 
عل cee‏ الثمل. :وقد انظلق. abt‏ وس خلال العام pr fen‏ 
وسيظل تحت التنفيذ pi aud ie‏ وتقوم عليه شركة (بي-بي-إن» (BBN)‏ 
مع جامعة كولورادوء وجامعة daas‏ ومعهد علوم coy di‏ بجامعة Xr‏ — 
كاليفورنياء وتقع كل هذه المؤسسات في الولايات المتحدة الأمريكية. 

ويستهدف المشروعٌ eU]‏ العنونة اليدوية لمدوّناتٍ Rs‏ بالإنجليزية (مليون كلمة) 
وبالصينية (مليون كلمة) وبالعربية (نصف مليون كلمة)» وهي تغطي نطاقاتٍ متنوعة 


«uel ظرات‎ (Blogs) وات )28 ,25 لوقن‎ dd as elle cule) 
واتفاق يجاوز تسعين ف المثة بين‎ Hm عالية‎ Bo وذلك عبر عنونة ذات‎ (cl le 


Bg X gall,‏ هي X gie‏ ك (ASV a-ha goes)‏ عل ce a‏ ال الكادلة؛ 
ترتبط فيها المعلوماتٌ النحويةٌ (إعرابية + تراكيب (tag 24 - SC‏ بالمعلومات 
اساي neum‏ او dnce‏ 
CS‏ إليه المعنى). وسوف يتيخ المشروع بعد إتمامه هذه المدونات المعنونة للباحثين 
بصورة مفتوحة المصدر من أجل تشجيعهم على تطبيق US LE‏ التعلّم "er‏ 
عليها سعيًا إلى تدريبها على تحليل وإنتاج هذه الارتباطات والتراكيب حاسوبيًا في وثائق 
جديدة خلاف تلك التي أنتجها هذا المشروع. 


EI 


ie NM grits eo Na RUE PIN ve 


cn M لض‎ E 
Ee ES الباحثين لجهودٍ‎ mu UT 


cob ll Je x55 MAI [Lod A Soll ol JI colL ENS 
old الحاسوبية‎ ASI ثم ترويض‎ 3 pte حلول رياضية‎ ole] ثم‎ dremel G 
في متناول قدرات الحاسبات الرقمية المعاصرة ويمكنَ بذلك أخيرًا‎ Grad الحلول حتى‎ 
إدماجها في تطبيقاتِ عملية ضمن إطار تقنيات معالحة اللغات الحية.‎ 

* العمل على العنونة الدلالية المعجمية - وكذلك العنونة الدلالية فوق المعجمية - لمدوَّناتِ 
نصية متوازنة النطاقات وذات أحجام كبيرة وبدقة عالية» وهو أمر تمس ال حاجة إليه من 
أجل تدريب مختلف آليات فك الالتباس الدلالي. 

ببليوجرافيا مرجعيّة 

.١‏ أنيس (إبراهيم): دلالة الألفاظ. مكتبة الأنجلو المصرية» VAY‏ م. 

.١‏ جبل (عبد الكريم حسن): في علم الدلالة» دار المعرفة الجامعية» الإسكندرية» 
MV‏ 

.Y‏ صيني (محمود إساعيل) وآخرون: المكنز العربي المعاصرء مكتبة «OU‏ بيروت» 

ط۱ ۱۹۹۳م. 

HSE cay el, Gee uel) ce ii‏ ا رن الملكة العرية 
السعودية» Me‏ ؟١٠5م.‏ 

p AAA co عا الکتب»‎ BYU ple عمّر (أحمد مختار):‎ o 

5. غالب (حنًا): كنز اللغة العربية» لبنان ناشرون» Yt Y‏ 

die .M‏ (وجدي رزق): معجم المترادفات العربية الأصغرء مكتبة لبنان» بيروت» 
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الفصل wales!‏ 
التحليل المعجميّ GYI‏ 


35 المُعترٌ بالله السّعيد 


-١‏ في التحليل المعجميّ. 

Y‏ - من مُكوّنات ال معجم الحو 

LLL -Y‏ العجمية الآليّة في مراحل الصّناعة. 

4 - من أدوات I LL‏ لمكوّنات المعجم yore‏ 

o‏ - أفكارٌ بحثيّة لأطرّوحات Sale‏ ودراسات مستقبليّة. 


-Y\¥- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها botes‏ 


=e 


gendi aen 
تنب عن كتين‎ ANG Al ت المُعجو‎ USS بمُعاجَة‎ omen يُعنى التحليل‎ 
dots فإن التَحليلَ المُعجميّ‎ «Gl يسَينء هُما: المبنى» والمعنى. ومن هذا‎ 
جع قرحت ان اميتي‎ Sey a tn اليج لحت فى‎ 
IUI ومُشتقاتها ومعانيها وأساليبهاء بالإضافة إلى شواهدها‎ ete وترتيبها وتعيين‎ 
Spl veel Je 
eee ae 
عنه في الصّناعة‎ Fa 9 والشواهد والاستعالات» ...)؛‎ go o^ Zoll المعارف‎ 
أو (وَحدة‎ (ssh Pr أو‎ (Lexeme الحديثة با ف > ب (لكسيم‎ esl 
تفرع الوحدة العجمية‎ $ |i, all al el وفي اللّغات الاشتقاقية‎ . eae! Joc 
الحقل‎ SU عن أصل [أو جذر] للكلمة. يُعرَفْ ب (المدخل المعجميّ)» ويُمكنٌ تعريفة‎ 
E T sly اذه لكو‎ a ee إليه مجموعةٌ من الكلمات التي ت‎ gad الذي‎ 
Ay ذلك‎ 


ists te) Et gi an Rar acme ul‏ لأجل الوصول إليه؛ 

بذلك وسيلة إزالة Xni, aod E‏ في استنباط المعاني Je Canal‏ اللالات 
zal oles i al‏ في السياقات الي ترد فيها؛ وتبعًا لذلكَ» fait‏ أن Shes‏ العا 
ا محجميّة U‏ اراح لصي يي . وبطبيعة الحال» ob‏ هذه BLS‏ مد 


2 
A 


s‏ الط الد 


p تبدأ بالمداخل؛‎ E i yall pedi ole الج إذن‎ Jeet ol 

عن js‏ مدخ cate pt dns‏ الوحدات Candi‏ ويتفرّعٌ عن كل وَحدةٍ di‏ 
أو de poe‏ من deas cenae Glall‏ كن فس معان A‏ يه ویتصل كل معنّى 
بشواهدٌ ومعارف مُعجمية آخرى» وهكذا o ag.‏ ليان هذه d agis GSU‏ 


ble Gli REN 


-Y\o- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ڇڅځخځ — n————"‏ 


elt من‎ Sy al عوامل» متها طبيعة‎ N lp a 

SB أنماطًا تلفة. وبطبيعة ال حال‎ eb al المعاجم‎ Óp الُستهدفة. هذاء‎ Seal, 
oU RO مُكوّنات لمجم [أو عناصره]. وقل سيل‎ ox هذا الاختلاف د 62% إلى‎ 
EJ رئيًا في العاجم‎ S لا تعنى بمعلومات التأثيل التي تعد‎ pola العاجم‎ 
لا تعنى بمعلومات التكرار التي تُعنى بها المعاجمٌ‎ RATE BUHL ia JI والمعاجمٌ‎ 
المعاجم باختلااف‎ lsi وقس على ذلك‎ «AUI MI d wei التعليمية‎ 


كن Sa‏ إن نال كرات العم ا كييك لزاه وما 
يكون مُعجً بالمفهوم 33 (es gy yi‏ مثل: (الوحدات call‏ التي عبر 4s‏ 
A‏ الموصوفة)؛ وهي sols AU‏ [الغامضة] i prl CT‏ 
FB‏ الالتباس عنهاء وكذلك المعاني الحا التي Zi‏ تعن «اللخة الواصفة)؛ وهي 
iu‏ الإفهام dale dy ; i‏ مُستخدمي العجم QAI t.‏ الأساسيّ من الصناعة 
المعجمية. 


من هذا المنطّلق» Sea‏ تصنيف ell CoU SA‏ وفق اعتبارين: 
- اعتبار elas Vy ganl‏ 
c‏ 5 تصلح as‏ امكو نات oy‏ تكون عنص | à‏ حيلف أنواع المعاجم» 


PES 


er‏ ا Aia iR‏ مصنوعة لأهدافٍ 
- اعتبار الثبات Ly‏ : 
Z RINT‏ بعص المكوّنات del 628 a scs‏ اللّخة وقوانيُهاء وأن 


تأخذ ات "ECCE IS‏ ; ديرا صحكم فيه Geral SU‏ ذاتها. 


aider M dicke 


SX qwe 


Iy والاختصا الثبات‎ e adl Te 

mal ist 2 E GAI مُكونات المعجم‎ e 
* + اا‎ cola gly jell \ 

: : معلومات المجاء والنطق‎ Y 

x * المعاني الوظيفيّة‎ Y 

+ - seal tall ٤ 

+ + ELE المعلومات‎ o 

ji + BY والعلاقات‎ J 1 

i + alg sil y 
* * EZ المعلومات الثَّار‎ ^ 
id $ die I مُستويات‎ q 
+ + [5530] معلومات التّكرار‎ T 


الحدول cle: ١-5‏ من الوحدات المعجمية à‏ المعجم Vy‏ 

ونعرضٌ فيا يأتي Zen‏ هذه [Sob Sl‏ على جدة» مع tel‏ عليها في ell‏ العربّ. 
A‏ 5 

(Entries & Lexemes) والوحدات المعجمية‎ 1-144 — Y, Y 


or تنتمي إليه مجموعة‎ PU هو ذلك الحقل‎ Lexical Entry veel jean 
CA jie وقد يكو‎ ABW واجدة [ني معاجم‎ d ii الكلمات التي : تشترك في‎ 


22159 dee ley T d arabo So أو مُعَرَّبة‎ PW به‎ 


لكلمة عر 


Ka E ALI الكلمات‎ is jhe فهى‎ Lexemes ssal ÎI clue Jl GÍ دخيلة؛‎ 


Sa car i‏ عن الدخل. 


Ab gs‏ (الجدول Ele (Y-I‏ المداخل والوحدات في المعجم العري. 


aM 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n— 5‏ 


| م | الوحدات الُعجميّة | المداخل الحجميّة | أقسامالكلام | أنواع الوّحدات | 

de KJ ١‏ عربيّة 
fel Y‏ ع ثار dé‏ عربيّة 
Y‏ الأثر اسم "ge‏ 
الباشا iss "T (bles‏ 
ET o‏ ام 

2 س ی کف z‏ 
Ée 7 5-0 1‏ 
Js v Y‏ عربية 
A‏ الكاتب vos‏ اسم is‏ 
q‏ المكتبة اسم عريية 
E‏ 5 يا حرف / أداة is‏ 


الجدول Y-T‏ نماذج من الوحدات المعجميّة في المُعجم spl‏ 


(Alphabet & Pronunciation) الطحاء والنطق‎ ols gles - , Y 
مستخدمي المجم إلى معرفة طريقة كتبة الوحدات‎ E Ji ا العلومات‎ La 
Peal لقواعد‎ ET TON boa uiis وكيفيّة‎ [amy الف‎ col gall gf] المج‎ 
d* RU مُتعلّمي‎ dels الأساس؛ حيث‎ 3 M" هذه المعلومات‎ o itty 

qe واف‎ ciuis el all 122 IE cal uai AE E RENT الإفادة من‎ 

فيا Ghee‏ بمعلومات الهجاء, Best‏ عنايةً المعاجم العربيّة القديمة Cae the‏ كانت 
تنص على Labs ol‏ ما CES‏ بالعين Abl‏ 1-2 ها عن ils ob, «asl‏ انيه CESS‏ 
ELL‏ مالا عن الياء» kal Bu CS BU Las S‏ عن الثاء التي 
نُوصَف ake EL‏ وهكذا . ومع تطوّر شكل الكتابة العربيّة XS‏ وظهور bI‏ وعلامات 
«da Ai‏ اميف d‏ العناية» حتّى تلات في أكثر المعاجم diei‏ 3 

LI‏ معلومات d gi‏ على المعاجم Ell‏ أن تكتفي بوضع علامات الصّبط 
yl ea‏ إلا ننم بعض ا معاجم التي i‏ بابراز طريقة نطق الوحدات 
اال باستخدام )59 الألفبائية RNV‏ هالاو International Phonetic‏ 
(Alphabet (IPA‏ وهي دوعا e ada‏ ادر 
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بباريس Association Phonétique Internationale‏ في n AAA‏ لتيسير قراءة 
ie‏ اللخات الإنسانيّة. eel gis‏ (الجدول (T-I‏ تصورًا لرُموز الكتابة الصّوتيّة 
للفونييات [الأصوات] العربية. 


| »J | ca »J | cea »J | c4 | 
الصوامت وأشباه الصوامت‎ Consonants & Semi Consonants 
f ف‎ R ) ? 3 
q à Z 5 B ب‎ 
k E 5 U^ T c 
1 J 5 D t e 
m e S T dz ج‎ 
n Ó d v? H € 
w و‎ 7 b D > 
y T £ d d 5 
8 C 
XC gall Vowels 
i (و) قصيرة 0 (ي) قصيرة‎ A قصيرة‎ (I) 
i: ab sb (ig) U: (و) طويلة‎ A aL sb (1) 


©, oN esed clus GU ds SN DUS و‎ oar A الول‎ 


(Grammatical Functions) 425 الو‎ ud! -Y,Y 
جاو‎ Ed المعجم في سياقات‎ S ui تي‎ Sees. ae 
عمومًا‎ KAU اکب انض لات رة وتقتصرٌ العام‎ dotes اكلم‎ SU] 
دون القياسيّة. وتأتي ا معاني الوظيفيّة في لمجم العريّ على‎ oS على المعاني الوظيفيّة‎ 

إحدى OSI pe‏ 
- (المعاني الوظيفية البتويّة ee: (G‏ بالبنية 2 23 للمُفرّدات؛ ومن أمثلتها: ما 
jai‏ بأبواب الأفعال dis il £ryli‏ ومصادرّهاء وصِيّغ التذكير TORET‏ 

وجموع التكسير. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n———————— | 5‏ 


- (المعاني الوظيفيّة (es AN‏ تعنى بالبنية ES Al‏ ومن أمثلتها : التمييز بون أقسام 
الكلام العريّ (الاسم والفعل والأداة)ء S jala‏ اللّازم uis n‏ 
والدّاعي إلى جود هذه المعاني في الُعجم V‏ لا eoa‏ لقاعدة نحو ؛ Rope"‏ 
الاهتداءٌ بها أو القياسٌ عليهاء e‏ تعنى به مصادرٌ التّقعيد a3 A pl‏ 
x‏ تبدو الحاجة إليها sold‏ مُستخدمي المحجم على توظيف colo sal‏ واشتقاقاتها في 
استعمالاتٍ E d‏ سليمة . وعلى سبيل المثال» ساعد GUI‏ الوظيفيّة البنويّة de‏ توجيه 
مُستخدمي l‏ إلى صيغة ة الفعل 220 (ecce‏ من الماضي «CS stet VES‏ 
و تُساعدٌ المعاني الوظيفية dam gi de sees UN‏ المستخدمينَ إلى faill ol‏ (أعطى) لا 
يستقيمٌ في الجُملة العربيّة إلا coed pell o e‏ بمعنى أنه فعل death‏ بمفعُولَين؛ وهكذا. 


(Lexical Meanings) Ecl uet -£,Y 
3] clgel p Goel Jo SLU enel Z éx المحجمي هو العامل المشترك‎ ali 
erem في تحقيق غاية هذه المحجرات من الإفهام وإزالة العُمُوض؛‎ UL عليه‎ Jod 
شريطة أن تكون‎ à A شير إليه الوحداث المعجميّة في سياقاتها‎ Sgi به ذلك المعتى‎ 
أو بعبارة آخرى» شريطة‎ E ie Hl عن العرف العام لدى‎ $e هذه السّياقات‎ 
هه‎ 
| e XU 
85 9 المعض الحجمی عل إخدى‎ go; 
تُشيد $ .^ إليه‎ gii Adi c pall وهو المعنى‎ ‘Literal meaning A ا معنى‎ i 
مدلولات الوحدات ا‎ 
الذي مل‎ pow P وهو ا معد‎ :Figurative meaning ‘s jll ا معنى‎ = 
ale J453 CEN ge هذا المعنى ذا‎ PCR للمعنى الحقيقيّ؛‎ nbs دلالة‎ 


A m REN‏ ا للوحدات XS [ols sali]‏ السياقات وأساليب التعبير 
تي suia‏ وبمك o‏ على ذلك بالوّحدة العجميّة (الَين)؛ om‏ ترذ 


أحيانًا فتفيد «عضو الإبصار عند الإنسان والحيوان»؛ وقد يراد مها PU eUl p»‏ 


-yfe 


258 dl PAN in Jl, e ots dE وترمي > جارا‎ t o dd 
Gail; eus» ad) p dE E وقد ترمى إلى‎ che gil ols) (s ue 
AS التي‎ uel على عَيني) وغيرها من‎ EN سبيل الود والألفة‎ de - تقول‎ 

e^‏ خلال aed j dae = Shes UAI‏ الح (الخاعين )لصت تشيرٌ إلى 
(الشَّعْر Je‏ فوقٌ Cá hs Ced‏ - إلى (خازن OUI‏ وحارسه)؛ 5 MIS‏ 
.= (القانون) te 53 dies A‏ الوتريّة) وإلى (قَواعِدَ وأَحكام LAS‏ 


(Etymological Information) FARE] وه -المعلومات‎ Y 


dé بتعيين المعلومات تي : تبحث‎ Lexical Etymology التأثيل المحجميّ‎ T 
yas c c ENU مرحلة ما قبل و تصوص‎ à "ER أصول الوحدات‎ 


w Ge 


AEE a id GAN eme E الغو حاوف‎ 


وقد auae peli [EIU pel PES Seal‏ من اللحات se cn ll‏ 
GUY‏ والإنجليزيّة والفرنسيّة» [phat‏ معاجمٌ خصوصة لذلك؛ عرفت بالمعاجم 
a Jia UT Xs‏ فقد ظهر التأثيل المحجمي في IDE A‏ 
في بعض تجارب الصّناعة المعجميّة E‏ عبر المكتملة» مثل endi‏ الكبير» الذي يعمل على 
إنجازه مجمع RU‏ العربيّة DU ŠI ks gd] jio‏ الذي deu‏ 
المركز Gl‏ للأبحاث في الدّوحة. وتعتمدٌ مثل هذه المعاجم في تأثيل coli‏ على 
تعيين التظائر المشابهة لمبنى الكلمة العربيّة ومعناها في اللُغات td FEL‏ بعض 
الفصائل SZ all‏ كانت على LAS OLDE the‏ 


poe -4,7‏ ل و العلاقات الد 43 (Semantic Fields & Semantic Relations)‏ 
Lai‏ ا Semantic Fields SY‏ المجالات الموضوعيّة J [SIVAN]‏ 
LS‏ مجموعة من colo ll‏ المنتمية إل خقل ممن مثل حقل (WD‏ الذي يضم 
(البنطال» seule‏ والعامة). وإذا كان ‘al jun‏ [وما شاكلة gi‏ الأصول] Js‏ 
صورة المدخل ا محجميّ ac: OYA J gi 5 WY! pole d‏ أوعية al‏ 
ف معاجع Gl‏ الو Lente ya‏ الى IP ERES E‏ الطلاقا مرج المع : 


OS 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


i‏ العلاقاث Semantic Relations SYA)‏ فهي dos‏ الرّبط بينَ الوحدات 
de dA enel GLU ole ai. d ssi‏ إحدى رن 


- العلاقات BY)‏ فقيّة: تكون Sy‏ جموعة من d» DIEN eo ll‏ 
متواز؛ مثل علاقات لاذ SLAI ALL,‏ والاشتراك quU‏ 
- العلاقات ia JI‏ که OS‏ بينَ he pat‏ من oll‏ التي gs‏ في مُستوى DNs‏ 
JU‏ [عمودي]؛ مثل علاقات (الاشتالء GA Pacer Be gly‏ 
ودر ر الإشارة إلى عناية المحجم go‏ بالملوضوعات في وقتِ مُبكّر؛ حيث DIC‏ 
اليد .عن JL Sel T call‏ والعلاقات GOVE‏ مثل: (الغريب 
(all‏ اللقاسم ET‏ سلام (ه)» و (جواهر الألفاظ) لقدامة 2 (VY) yum‏ 
و aS)‏ اللحة juny‏ العريئة) تعد اللاك بن مد التعالبي C274)‏ 5 (المخصض) لان 
سيد eda‏ (/45ه)» وغيرها. 


(Lexical Evidence) P sali اهد‎ pil EM 
حقيقيٌ للوحدات المعجميّة‎ Gd وجوه استعال‎ Jo Tele تعد الشواهد المعجمية‎ 
Geri في الوحدات والمعان‎ ew بذلك إحدى وسائل شرح العنى» لا‎ d sida, 
dese العم‎ Lat Bi esas, اللغوي‎ ell التي تحمل دلالاتٍ عير دائرة في‎ 
كي 5 يا من‎ Cle gat وهي‎ En Corpora rages eb 5a) الغالب من‎ 
يلجأ‎ obo! وامُستمدّة منه أساسًا . وني بعض‎ ig pa pill اللحة المكلة‎ yo ya! 

ا OUR‏ مقامٌ aal AUI‏ ا معجميّة. 

والواقع أذ اختيار الشّواهد Y Gall‏ يعم بصورة عشوائيّة؛ إذ ينبغي أن ns‏ معة 
غاية الإفهام وإزالة التباس GUI‏ والمعاني. هذاء ينبغي إخضاع الشوافن لج NOS‏ 
الصوابط المنهجيّة التي 5 ^as‏ تحقيقٌ الغاية . ومن هذه edal pall‏ على سبيل المثال : السّلامة 
eed sce IU teta at al‏ ا ED eid d an es‏ 


(Historical Information) Ix 2 و 8- المعلومات‎ : 
الحادثة في‎ Ul cl I بتعقب‎ ADI فيالمعاجم‎ e JI عنى المعلومات‎ 
REA EN eee et 
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اللغة]؛ كا تبحث ف المستعمل ello‏ والمات من 5 Ax col‏ غير تارحها: 


والواقع أن التعاطي مع هذه المعلومات ليس es Vj‏ في المعاجم العرييّة؛ ae‏ 
wi Ae wab suse‏ كبر من الرونة EK ele‏ 
ا . فبالإضافة إلى es 1% WOT‏ صورتها dell‏ لثات السنين فقد ضاع ASN‏ 
من ico esi LL‏ لاسيًا OSA EL BI‏ التَّدوينَ الأولى من عُمرها المديد. 

وتجدرٌ الإشارة إلى وجود علاقةٍ وطيدةٍ Gy‏ المعلومات S40‏ والمعلومات eI‏ 
التي سبقت الإشارة إليها . ولبيان ذلك d sd‏ إل إذا كانت SELL Ln Jai‏ 
بالأصل PU‏ كانت عليه الكلمةء فالمعلومات ad SHE‏ بتعقب BL UBI‏ على 
هذا الأصل عبر المراحل الزَّمنيّة لمتعاقبة ald‏ ومن ثب TET‏ تخضم FRATRE‏ 


۲ - مستویات الاستعال (Usage Levels)‏ 
وهي الُستويات التي تتحدّدُ من Ile UAE‏ الوحدات Bs Kamdi‏ اعتباراتٍ 
Lacie‏ لوت منها على بعل المثال: اعتبار qiu) JLAY pe‏ مرد نادر» 
ER‏ واعتبار eol iz ir "KC NT Xd, &- UNI‏ واعتبار qx) OUS‏ 
اسك سه ex‏ سه . وبطبيعة الحال B‏ 


(Frequency Information) معلوه مات التكر ار‎ —\s 

d odis. T NV KO X 
معي أو رفضه ها . ولهذه‎ il Al من يول المجتمع‎ ASE إلبها عند الحاجة إل‎ 
ray qui dela due Lo pas في صناعة المعاجم اللعليمة‎ SAT المعلومات‎ 
استخلاص هذه‎ qe في اللّغة. والواقع‎ Uf oo colo all على الاهتداء بشهولة إلى أكثر‎ 
fail da. lal الصعوبة کان ا‎ $5 2d ind الصّناعة‎ BLS col. gall 
عل‎ RÀ على وحدة مُعجمية‎ FAT الكلمات‎ bul Sus الاشتقاتيّة؛ حيث‎ x l 
MCB) sae gM che TWIN... co S 255 6 28 کے‎ ( LIEW تعد فى‎ Le gant 
دقيقة.‎ Ñi po ALLS يستدعي‎ gill الأمر‎ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


udir :‏ ا لمعجميّة الآليّة في مراحل الصناعة 
مر الصّناعة ا deus ed Lexicography‏ أساسيّة uu‏ 
JS diez, Ju tae‏ مرحلةٍ مجموعة من المراحل الفرعيّة التي تتح 
ضوء طبيعة العجم adl‏ منه 2d Ai Merit Gr hdi ag‏ 
تنفردٌ بها مرحلة مُعينة؛ لكنّها : تتم في المراحل الثلاث» CIEL‏ وطرائق dae‏ وبيا 
ذلك على التحو الآتي: 
exe Oui, Y‏ 
i ep €‏ المورد الأساميّ الذي BL tue 05s‏ ا مجم . وإذا أردنا 
نصنع مُعجًا EE ud‏ لواقع GU‏ الطبيعية ue pe‏ ا 
E rd x‏ لضوابط الصناعة ali‏ الحديثة» Gb‏ نصنع م فيك sa‏ 
gil edi‏ 15 مورده الرّئيس] à‏ صورة ERE Corpus id qs‏ ویشار 
ad ol‏ إل st‏ غير مُنتظمة من الصوص ois t‏ واقع اللغة المي Md.‏ 
y‏ أساليبَ إحصائيّة» o‏ يتناسبٌُ مع الأهداف المنشودة؛ eSI d s‏ في بياناتها 
بالإضافة أو الحذف أو التعديل. 
في الصّناعة الُعجميّة ينبغي أن 655 الْمدوَّنة E‏ حقيقيًا للّغة المجتمّع؛ 
سوا اللغة المستخدّمة a‏ أم الي كانّت مُستخدمة في > حقبة زمنيّة أو مكانِ مُعَيّن. 
هذاء farts LEB‏ على أعدادٍ هائلةٍ من الكلمات؛ تصلٌ إلى الملايين» وتتجاورٌ SLAM‏ إلى 
Gl be‏ وكات ا de‏ يحض LLG OU SLI Reda LEVI‏ هذه الأعداد من 
الكلمات ستكون بحاجة إلى وقتٍ Mt‏ كبيرين» É‏ يستدعي Čab g‏ الآلة على نحو 
تسحدق ATE ane‏ وال Ae.‏ 
تستدعي XII Lull‏ لمكوّنات الُحجم في مرحلة الجمع إخضاع LLAU SI‏ 
عبر مُستويين» هما: مُستوى ALLS‏ المباني» ومُستوى ALLS‏ ا معاني؛ وذلك باستخدام 
أدواتٍ مُعيّة (سيأتي الحديث عنها لاحمًا). وينتجُ عن المستوى الأوّل: (المداخل 
والوحدات Konal‏ ومعلومات GL SE‏ والمعاني Gelb M‏ وعن الُستوى EW‏ 
(المعاني aml‏ والمثقول والعلاقات QV‏ والمعلومات AASB, Xu Ó‏ 
(See eo d y cal LUI;‏ 


1 
o 
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GOW -v ۳‏ مرحلة التّحرير 
يقوم py‏ المعاجم الحديثة على نظام التحرير المي Dictionary Writing‏ 
System‏ أو ما d‏ صناعة ا DEO Production /Publishing‏ 
System‏ وهو Ete ky‏ تفاغليّة» Jess‏ على قاعدة بياناتٍ للمعلومات ا 
il,‏ للتّحرير المعجميّ aoo oet ui SE ORENT‏ 
اللتخدمة في صناعة المحجم» » بالإضافة إلى الواجهة Cell‏ لنظام dels y pp‏ 
نظام التحرير cell‏ على إخراج هيكل الجم في صيخةٍ Eu‏ ومنتظمة AE s‏ فيها 

مناهج المحرّرين GS Ul‏ في صناعة qal‏ 
والواقعٌ Of‏ أنظمةً m‏ المحجميّ ليست أدواتٍ QW LL‏ المعجميّة 
بقدر ما هي أنظمة adel‏ وإدارة البيانات. فهي ساعد على استقبال le‏ 
Cul dii‏ ووضعها في يكل ied‏ مکی eol‏ فيه واستخلاص Laat‏ 
وإحصا داك وو هاف أنظم الكرير كذلك في ضبط امقول والعلاقات ERU‏ 
colo zal‏ ونمذجة المعاني لحت للمفرّدات E‏ تتبعها. وتتفاوت درجة å‏ الإفادة م 
أنظمة التدزير ال c‏ إدارة المعلومات مه iss Slog lala cda C‏ 

PIENE un à GI ole 2d 


PE PRENE ui - sv 
الآلة في استخلاص المعلومات المعجميّة في مرحلة‎ no ots. yu s إذا‎ 
دورّها‎ OB وا ميكلة في مرحلة التّحريرء‎ Aly poll الجمع» ت في‎ 
على‎ 55315 so حيث‎ s a في مرحلة‎ S على الجوانب‎ € chis 
الصتاعة‎ T Gene ا ا‎ S 3 لعي‎ at ele 
£L GUISE is sy SN is o لمكوّنات المحجم‎ BW Lil ob هذا‎ 
LUNs Fell با كنات التي تتفرّعٌ عنها . وعلى سبيل‎ ba y بشکل مُباشر؛ لکتھا ت‎ 
ومعانيهاء‎ Poul تتبع الوحدات‎ 3 ui Multimedia إلى ضبط الوسائط المتعدّدة‎ oy 
شرح للمنى ن العاجم انررق‎ dad والسومات التي‎ e Jc 
والصّوتيّات والمرئيّات [في المعاجم المنطوقة]؛ كا يُستفادُ منها في ضبط مرّجات المعاجم‎ 

ig ll‏ إلى ذوي الاحتياجات الخاصة. 


-YYo- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n————X 7 D.‏ 


€ - من أدوات II ALLL‏ لكوّنات المعجم sill‏ 

SA ١‏ العديدٌ من أدوات <a) IW ALL‏ الإفادةٌ منها في LS‏ مُكوّنات ا محجم 
اللُغويّ. ÉD Ab shy‏ 1-7) أبررٌ أدوات GY Lull‏ المعجميّة في اللغة ody pall‏ مع 
SLY‏ عن المعلومات المعجميّة التي Sef‏ استخلاصّها عن عمل هذه الأدوات. 


المداخل والوحدات 


= نظام الفهرسة ay‏ 


1 


z 


E 


nU 


مُستويات الاستعمال 


s 


المداخل والوحدات 


المعاني الوظيفيّة (البنويّة) 


و 


أدوات معا 


ib‏ مُكوّنات 


(ESKI) الوظيفيّة‎ gla 


المعان الميعجميّة 


å 


i 


gall المعجم‎ 


ALS المعلومات‎ 
Someah امعان‎ 


الحقول والعلاقات الذّلاليّة 


ille seed Legler‏ نظام aL LM‏ الصّوتيّة الكتابيّة 


الشّكل ١-١‏ : من آدوات DW ALY‏ المعيحمية ف اللغة العريئة 


۲ - 


See 
be ohil على إعادة ترتيب‎ Text Indexer 2f يعمل نظام الفهوسة‎ 
مق‎ ME على إحصاء تردّدات هذه‎ ielai اللغويّة؛ كا‎ ot jal 
Fa ak ل‎ Aca ae edd 
GR هذا التظام‎ Hee Sec atl ا‎ tile ait 
في الوقت ذاته‎ Ges) ipa لا سيا عند التعامل مع أعدادٍ كبيرة مج‎ AGLI 
من مُوافقة هذه‎ SEI FIG الآلة‎ OS اليدويّء لضبط‎ Eel لا ُغني عن‎ 
ل‎ e تاكن‎ EA S CU ec ole 

Qo etn abd ob dece O1 ci pud‏ هي 
puo uoc qb E‏ 
- نظام الفهرسة الجذعيّة: : ويقوم بترتيب Gs ls al‏ الخذوع da, «Stems‏ 
Estoy obs a‏ 
- نظام الفهرسة الجذريّة: ويقومٌ بترتيب ola il‏ وف ا دور Roots‏ ويستدعي 
هذا UI‏ وجو آليِّالإزالة الالتباس البنوي بين BEI toil‏ شكلهاء 
المُختلفة في أصلها؛ على نحو ما as‏ مثا في كلمة LA]‏ حيث تذل في 


صورتما BÄ‏ على الفعل الماضي من الجذر (ف ل ك) oss‏ أيضًا على حرف 
الحرف (J)‏ الذي s‏ فاءُ الاستئناف» ول اة كاف الخطاب؛ ونحو ذلك. 


والواقع أن طبيعة fal‏ بصورة كبيرة في AEN‏ البشريّ المبذول لاستخلاص 
الا الح ؛ بل إن منهج eene Al‏ في معاجم ixl‏ الواحدة 


225 


ud d. B BM que‏ ال إلى مجهود 


والمولنديّة QUE EE EMT Lal) ous “ey‏ نظرًا لطبيعتها 
الاشتقاقيّة ونظامها الكتابي. 


EYE 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها Lyles‏ 


Us -1 , £‏ السياقي 

Concordancer cale Sissi e‏ عمل نظام الفهرسة cs eI‏ يُعنى 
بتعبين سياقات iai S‏ على ide‏ بعد إخضاع جملة صوص SI ail ESI‏ 
ويُساعدٌ ÉSI‏ السّياة a‏ بذلكَ على استخلاص المعاني Gamal‏ من السّياقات؛ إذ 
يكن B‏ معنى as all‏ حال استخدايها في Sus Lg, Gall sedi‏ 
ul‏ أيضًا في استخلاص الشواهد المعجميّة؛ delas |S‏ على تعيين مُستويات 
Jie Yl‏ 

ونظرًا للتداخل الواقع Gy‏ الكشاف ALII‏ ونظام الفهرسة SI‏ لية» فكثيرًا ما 
à Ladas‏ أداةٍ واحدة ALL‏ على pull‏ الوارد في (الشّكل A(Y=7‏ 


al هن‎ WS س‎ EI 


f eei" 
ITI Em 


il UE 


CT IPLE EMT at MIT 
ای هذا انوك وها اعد‎ EET n T 


Tus uad عا ای هدا‎ Ue M رت‎ 


d 


كن حا - له ها أمسس هذا الفوك! حلت dr jal‏ 


1 


هنا لكام © ءا أحسى. WU MT NO‏ 
وط od‏ هده Gee! Antal‏ وهب وأشهى عدب يا 


Ade sil Ud» das ool t MM ماقت‎ ud 


311 


* 


e 


it 


4 - A errs 81756 الحسنة‎ WR Title | Sts coe الكلمات المجركة = 9928 |مجموع‎ 


32 و 5 [i‏ " £ 
الشكل 1-5: نموذج من عمل المفهرس الآيّ والكشاف (SLI‏ (آداة (aConCorde‏ 


-51- 


£ , - نظام التحليل d AMI‏ 
G A fll‏ أحد gal‏ أدوات opaj ALLS‏ في ali‏ العربيّة؛ حيث bok‏ 
بتعيين جُذور الكلمات JI‏ أصوها] وتحليل كل كلمةٍ على عناصرها D EI‏ 
والسّوابق» GU‏ بالإضافة إلى تعيين الفروع v Lemmata‏ عد e o Mri‏ 
للوحدات المعجميّة. OB lies‏ نظام التحليل (AS LA‏ أيضًا Jos‏ المفهرس «NI‏ 
حيث يضع المداخل [الممثلة في الجذور] والوحدات العجمية MEANT‏ في ga‏ في 


الصّورة التي ينبغي أن تظهرٌ عليها. ومن ناحيةٍ أخرىء يُساعدٌ Gall flat‏ على 
تعيين المعانى الوظيفية البنويّة ة للوحدات الُعجميّة. AS obo‏ (الشّكل TV‏ نموذجًا 
i BI eed‏ ق X‏ 


OUTPUT = s 


ee CO ^ 
| IINNNETIYDUT ERO ONNECCUIETIINE NN ١ 
EI "UTE NEC UIETTINE NN 
pe | eel ede ك‎ 
Ei T LN SS ae 
-~ a 
7 T 7777 فك إن‎ 0 
NENNEN T C IN غ لفرت | اتويت‎ | 
eT | ب ا نا‎ 
eS: 0ه لاحت كنا 02 هه‎ is 
See INC GEESE NN 
ي‎ ee M 
E IBNE — TE mE. ee 
EENETITTUUIIDECEENECSÓOECPINCOMO 
اد ا ا ا‎ 


CAlkhatil العرييّة (أداة‎ (3 G i نموذج لمُخرّجات نظام التّحليل‎ ON SÉ 


-YYa- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


ue A نظام التحليل‎ - 4 ٤ 
ou A بتعيين أركان الجملة‎ Syntactic analyzer ie E dei ê يقو‎ 
کےا يقوم بتعيين وظائف هذه الأركان وتوصيفها من‎ ‘Parts of Speech بأقسام الكلام‎ 
عمل‎ by كيب في اللّغة العربيّة تستدعي تداخلا‎ WI طبيعة‎ Of والواقع‎ ZS Uda GI 
d عوامل؛ منها:‎ Sad نظرًا‎ VI وأدوات إزالة الالتباس‎ És المُحلّلات‎ 
سيا في ال لاف‎ Y] edly الاسميّة‎ Gy £55 ا لجملة العربيّة الواحدة‎ 
تتجرّدُ في كثير من‎ NE, pl بصورة عير مُطّردة» وواقع الكتابة‎ WAL أطوال‎ Zs, 
des) Jie 355 ويقتصرٌ‎ AUS الأحيان من علامات الصّبط بالشّكل» وغير‎ 

صناعة الُعجم على تعيين المعاني ES Sb Il‏ لوحدات المعجم. 


لونغ بيتش AST SH)‏ المتحدة) 51( er‏ کد + , حياة المتشرد ستيغن كنت عندما عئرت عليه 
E‏ دولار ربائه بات قادرا على رضع حد لعشرين ستة عن هياة التشرد في 
.شوارع مدينة لونغ بيتش في ولاية كاليقورئيا 


20000715 AFP ARB O00! -pos xri 


edd tegay-an3M 5 
tagay-WwNERHB PERFECT + be changed;ibe mode + 
tagay -ar VERB PERFECT + ba changed be modited + 
taegiyr 


gay ~ are! 

VIF Se VERS “ i 46 E * attack invade sraid 
IV3FS«VERB, IMPERFECT itjthey jee + chanmge;modlfy + 
1V3FS«VERP IMPCESECT it;thogy;che + make jealous;sroucc 
IVZMSeVERBR. IMPERFECT uou [maMc.aQ.] * ehange;modily + 
IVZMS«VERD, IMPERFECT 
IVING VERD IMPERFECT 

VERG PERFECT 
0 


الشّكل 5-5: نموذج ay‏ التحليل الث 25“ فى العربيّة (Penn Arabic treebank)‏ 


الاب 


IYI نظام التحليل‎ co, ٤ 

S y‏ عمل eek‏ الدّلايّ Semantic Analyzer‏ على lll‏ الح للمفرّدات 
في سياقاتها . ومن التّاحية Gd CUI‏ مُكوّنات المعجم؛ ينبني نظام التّحليل GNU‏ 
على ما Word Sense DECDIPEUARON cus Y gea 55 PAR ox‏ 
Aes. ((WSD‏ هذه VI‏ فكرّتها N‏ من المتصاحبات [اتلازمات] Zhall‏ 
Ris J Collocations‏ عن la‏ من lS‏ تتلارَم ^22 Lilo‏ في ET dj»‏ مي 
BUS‏ الفعل والفاعل (مثل: صاح LUI‏ ساد الصّمْت)» وعَلاقة الإضافة (مثئل: عابر 
سبيل» قاطع طريق). ويُستفادُ من نظام التّحليل DII‏ استخلاص المعاني Bacall‏ 
كمرحلةٍ تالية لرحلة الكشف السّياقيَ» Lo ed‏ عند Je‏ مع مجموعاتٍ كبيرة من 
السّياقات تہ كا تفن رین استکشاف انملومات FORTE‏ 
tele‏ اتات الوعحدة eon]‏ وغل der‏ المثال» سترتبط الوّحدةٌ (القطار) باللغة 
SAS Lye Le PRE ERANT‏ نكن ال الب وال Adages gh Sy‏ إذا 
صاحبّتها BUS‏ مثل (القافلةء الإبل» ...)ء وبالعربيّة الحديثة à pelly‏ إذا صاحبّتها 
Us‏ مثل (التذاكرء السَّكَّة ...)» وهكذا. 


| م JY» GLEN‏ | الرّمان | المُستو E‏ 
١‏ وَإِستبّحنا سَنامٌ الأرض إذ aad‏ القطازٌ 150 س4 الندية 
fo BEAN 5150 J st Y‏ شنا القطار A‏ | الا | deal‏ 
Y‏ فلآح هم من بَعْدٍ قطارٌ إبل Y‏ 5ه | الوسيطة 
£ ومن ila‏ ما كان معها قطار جمال Y MS‏ 5ه | الوسيطة 
o‏ ثم ساف إلى بلده على القطار الحديدي aoe] Y‏ الحديثة 
ge% cala 1‏ المرافيع أو حطات القطار arar Y‏ الحديثة 


الجدول 4-5 : نموذج للمُتصاحبات DII‏ على 1958 العربيّة في AYN lest Df‏ 


£ او اجات 

d‏ شبكة الكلمات WordNet‏ موردًا رئيسًا في الصناعات zu‏ الحاسوبية. 
وهي ليست LLAU Hal‏ الآلبّة [uu‏ الق لكنّها ee So‏ لَّ بالمعارف» 6 
NOR‏ اوناك اش ENE‏ 


i x 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
0 ال ييا 


قاعدة بيانات مُعجميّة 2 NE ČEZ cLexical-Semantic Database‏ فيها 
إلى أقسام الکلام د bai udo: e‏ سلاسل ege‏ من BEREIT‏ 5 أو 
المفاهيم dos NES Synsets‏ معانيها 57 فيا بينها بشبكة من PAN RUCHED ES‏ 
وبهذا التوصيف» الإفادة من شبكات الكلمات عند ALLS‏ مُكوّنات ت ا معجم 
eau‏ في es‏ بع المعاني ا والاستدلال عليها؛ ىا يستفاد من شبكات الكلمات 
عل el a‏ ل OY YA il d gl cae‏ 


T A abic We dot E 


Araka Vos vet wat 
© Ung diac ics. Mbt hpa Pakwan beat 
Malic were Jut 
Aa abac oot a 
Dew عسوم‎ L wd nae 
Pari of speech any pari ot speech -| 


ary ILE A بشرى,ندالط‎ BS fl d عمل صل‎ 


Ghows of لسعم‎ ten 
نوع من دمل سکن بوع من لیل‎ ui أو وغ مز تل تناج نوع يل قمل.‎ ded من لمل.‎ + y AS UU نمل ةف نوع بن فمل لض لوع من‎ tuu 
St نوغ من فثل, لياس لوخ سن‎ ds نوع من فمل. شرعية نوع من فمل-‎ cis M etra ets I بوج بن‎ pil 


Aa Word Tree Symons ل ا‎ Anasi 


الشّكل 0-5: نموذج لشبكة الكلمات في العربيّة (Arabic WordNet)‏ 


at‏ نظام ALLA‏ الصّوتيّةَ الكتا 


bb de eddy — mc هو وّحدة‎ Phoneme الفونيم‎ 

d ibus. PCIE‏ الصورة المكتوبة (الجرافيم (Grapheme‏ الذي Fee‏ عن أشكال 
المحارف. EU Jie m:‏ الكتابي à Phono- grapheme etal‏ 
تعيين معلومات الحجاء والنطق ESE gé‏ القواعد القياسية Ade She o d‏ 
sali ds‏ العربيّة يبدو هذا النَظامُ في صُورة ما يعرف IL‏ رَومنة Gy FA‏ العربيّة 


eye 


T Romanization of Arabic‏ كتابتها ac‏ رومانيّة [أو [XN‏ حيث تل 
حارف الألفبائيّة XJ ll Ú yall‏ کان خارف RU‏ العربيّة؛ d»‏ بعض الأحيان» 
bala bis‏ الما بط أخرى للتّحليل BBN‏ أو التركيبىٌ. 


| الصّورةالمكتوبة‎ | galli ea | م | الوحدات المعجميّة | قِسمالكلام‎ | 
CS kAtAbA فعل‎ os 1 
dale CEhADA فعل‎ dale Y 
EM PISLAPLARA ties zil Y 
YE 2ALIAyl-on = muU 1 
الذي‎ 2AllAdi: ol الذي‎ o 
5 2ALwoDD-on el الود‎ 1 
ilas 2An-niS?-o التساء اسم‎ ۷ 
إن‎ Pin إن حرف / أداة‎ ۸ 
ol p حرف/ أداة‎ ol 4 
E kAy حرف / أداة‎ 0 E 


[KEII s SAI] الفونوجرافيّة‎ LUM Oe ZZ الجدول 5-:: نماذج‎ 


o‏ - أفكارٌ Hole oles bY Bow‏ ودراسات مُستقبليّة 


x ^ zia QUE ie‏ يه عن | PT E al uli‏ وحداثة 


nee a 


2 AES 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—‏ 


3 "NE 
موضوع الفكرة الأولى:‎ - ١و‎ 


£ 4 
أنساق المداخل والوّحدات في المعجم العربّ ebil‏ 
ale Slo‏ 


o 


* فكرة الدراسة: 


تقوم فكرةٌ الدّراسة على حصر وإحصاء أنماط المداخل والوحدات Enel‏ في 
بعض المعاجم العربيّة ا محاصرة أو أحدها؛ وتعبين الأنساق aL‏ للمداخل 
cl Du oe‏ أو gb‏ 15 وللوحدات oe‏ 05 ^22 $2 أو S a2‏ 
ضبط هذه الأنساق على أساس منهجي يُساعد في تقويم صناعة المعجم العربي. 
مادّة الدّراسة: 
مُعجم [أو أكثر] للغة العربيّة ا محاصرة. 
الأسئلة Roc‏ 
e‏ أنساق المداخل والوحدات في g l reall‏ ا حار € 
* كيف el‏ استخلاصٌ منهجيّة لضبط بنية هذه الأنساق في صناعة الُعجم؟ 
منهج الدراسةء ومجال البحث: 

2 تقوم الدراسة cel de i Fall‏ الوصفيّ «ler‏ ويَتتَوّعٌ Cand Sle‏ بون 
الإحصاء gU‏ والصناعة PUER.‏ 


و -Y‏ موضوع الفكرة الثانية: 


jou‏ مُعجم ÉL tle‏ لذوي الاحتياجات الخاصّة 
mel ٠‏ والتمودّج» 
eos‏ 


nu‏ مكلو cito ats £e da d‏ مساعدة ذوي الاحتياجات 


seis 


o 


لخاصّة من فاقدي ll‏ على الع أو الإبصار على فهم BDI‏ وتعلّم osi‏ 
وإدراك نظامها «Cornet!‏ »مع تقديم نموذج حاسُوب الباحث من خلاله 
deu‏ المنهج. 

* مادّة الدراسة: 
مُعجمٌ عرب مُعاصِرٌ [أو مجموعة من المعاجم]ء و gue‏ ل ة للعربيّة 
المُعاصرة» وقاعدة بيانات دلالية معجمية. 

٠‏ الأسئلة البحزيّة: 
* ما lal ea‏ صناعة مُعجم عرب لذوي الاحتياجات FLS‏ 
x‏ إلى GI‏ مدّى Sa‏ بناءً وتطوير مُعجم عرب مُعاصر في بيئةٍ ES gale‏ تفاعليّة؟ 
٠‏ كيف يُمكنٌ Le gs‏ الفئات Aged‏ من تعلّم cola Sall‏ ومعرفة المعلومات 

DV GE Snell‏ دون dewey‏ شرع ؟ 

* منهج الدراسةء ومجال البحث: 
تقومٌ Gl ial l‏ حة على المنهج الوصفيٌ dle ERES‏ البحث بين ELA‏ 
Peeper meee‏ 

Roel ori uat. 4‏ 
0 , - موضوع الفكرة الثالثة: 
Br os 2 1 z 3‏ 
التوليد 1T‏ للمعاني في معاجم اللّغة العربيّة المعاصرة 
ALLS‏ حاسوبيّة في ضوء تقنيات إزالة الالتباس (AY‏ 

* فكرةالدّراسة: 
aus‏ الدراسة المُقترّحة أحد Sal‏ إشكالات الصّناعة المُعجميّة الحديثة؛ 
ونعني إشكال استخلاص المعاني المُعجميّة من السياقات. وتقومٌ الفكرة على 
بناء مدونة xd‏ للعربيّة المُعاصرة. G3‏ إخضاع مادّتها eel‏ والتّجريب على 
تقنيات إزالة الالتباس GY‏ والإبانة عن فاعليّة هذه التقنيات في استخلاص 
المعاني وتوليدها Ef‏ وتقييم ييم المَخْرّجات استنادًا إلى معاجم عربية i jeh‏ سلقًا. 


S 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


e‏ الدّراسة: 
x 250‏ مكثوبة (G25)‏ مُستَمَدَ M‏ من نُصُوص Ball BU‏ ا لمعاصرة 


لتكون ola‏ للتدريب والتجريب» ومُعجم عربي مُعاصرء ,5$ SUO‏ للتقييم. 
e‏ الأسئلة pees)‏ 
° ما شكل المعنى في المعاجم العربيّة المُعاصرة: وما leg‏ وما هي القرائن 
x‏ & الى لمك le Ge ON sew‏ اا FEU‏ دة الواحدة؟ 
* كيف يُمكنٌ Gab‏ تقنيات إزالة الالتباس GUY‏ استخلاص المعنى 
وتوليده؟ 
٠‏ إلى أي BSF cle‏ توظيف هذه التقنيات في ALLS‏ إشكالات صناعة 
المعجم؟ 
* منهج dal il‏ ومجال البحث: 


LN su مال السك‎ Co he الوم‎ geh ارا غل‎ e. 


ه, ؛- موضوع الفكرة الرّابعة: 
jou‏ قاغدة Ms £505 oly‏ لأغراضن الصّناعة ا معيحدية العريئة 

* فكرةالدّراسة: 
ul | oa cal d ed‏ طون cn Loses‏ ميد Sill Ua‏ 
SYA‏ 9,53 موردًا للصّناعة المعجميًة العربيّة. وتقوم e‏ الفكرة عل إعداد 
ما iis‏ ال ميكل أو ee eu‏ لشبكة les nawî WordNet eus‏ 
ومُعطَياتها من واقع اللغة العربيّة المُعاصرة» لتكونَ bl‏ على تمثيل المعاني 
المُعجميّة على نحو دقيق» مع تقديم نموذج pala Sema‏ منهاء SÉU‏ 
من مناسيّتها لأهداف الصّناعة. 


عمو 


* مادَّة الدراسة: 
شبكة CLUS‏ العربيّة Arabic WordNet‏ وعدد من شبكات الكلمات 
ge Mota nad Note hb‏ 
e‏ الأسئلة rene)‏ 
e‏ كيف نبني قاعدة بيانات ÉN‏ مُعجميّة للعريية؟ 
٠‏ كيف يُمكنْ توظيف شبكة الكلمات في تطوير قاعدة البيانات؟ 
* ماالعلاقات الأساسيّة في قاعدة البيانات المنشودة» وكيف يُمكنٌ توليدها 
de‏ وإلى Gol‏ مدّى 5542 اففادة من خُر جات التوليد SS‏ 
* منهج الدراسةء ومجال البحث: 


Siete صني وس ال‎ a ion dea tM ps 


0,0 موضوع الفكرة الخامسة: 
بناء وتطوير نظام مفتوح المصدر للتحرير p i‏ 
iÍ Ló‏ حاسوبية» 

* فكرة الدّراسة: 
مع جود عدد من أدوات التحرير المُعجميّ» SY‏ اكثرها لا يدعم الل 
العربيّة I‏ كاملا ولا يتناستٌ مع بنيتها المُعجميّة. ob dib‏ الدراسة 
المُقررّحة (e gogo gl ue‏ للتحرير المُعجميّ qund‏ يتناسبٌ مع 
طبيعة RU‏ العربيّة من ناحية» oes‏ مفتوح z‏ المصدر Open Source‏ من ناحية 
أخرى. Gul;‏ من ذلك GSE‏ الباحثينَ من استخدام نظام تحرير مُعجميّ 
غري بلا قيود» وتمكين العاملين في حوسبة اللّغة Le ll,‏ وتقنياتها من تطوير 
ذلك التظام وإثرائه. 


-YYv- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
n—UuUÓ L|‏ 


* مادَّة الدّراسة: 
ic pat‏ من المعاجم QA‏ المُعاصرة» وقاعدة SLL‏ مُعجمية ails‏ 
ci jx‏ 
TAE NL‏ 
يا ما المواصفات القياسيّة لنظام التحرير المُعجميّ العري؟ 
e‏ إلى أي مدّى يُمكنٌ الإفادة من أنظمة التحرير المُعجميّ في صناعة مُعجم 
عربي؟ 
* — ماالخُطوات المنهجيّة لبناء وتطوير نظام مفتوح المصدر للتحرير المُعجميٌ 
cq ad‏ وما الرّؤية المُستقبليّة لدعم هذا p gl‏ من أنظمة التّحرير؟ 
* منهج Aalst‏ ومجال البحث: 
تقوم de Fall Lal Nl‏ على المنهج الوصفيّ» dle ES s‏ البحث بين ELM‏ 
الحاسوبيّة والصناعة المعجمية. 


-YYA- 


ببليوجرافيا مرجعيّة 

TANA B دار العلم للملايين» بيروت»‎ ca pall oy shh البعلبكّي (رَوحي):‎ .١ 

qa xl OUI dhe للّغة العربيّة»‎ t JI بالله): حوسبة المعجم‎ Feel السّعيد‎ Y 
YS EY E tall باعل‎ IG Cy inl Geet مكدب‎ 


*. السّعيد dl)‏ بالله): علم الدّلالة ونظريّة المعنى دار GLB‏ القاهرة» TAY‏ 


I:‏ السّعيد EAU‏ بالله): RE "PEE‏ العربي» SN ie‏ العربي» مكتب تنسيق 
التعریب LLL‏ العدد 1/5 .7١15‏ 


Y القاهرة» ط۲‎ AN dis عكر (أحد حُتار): صناعة الُعجم الحديثء‎ io 
. 1991 مختار): في علم الدلالةء دار المعرفة الجامعية» الإسكندرية»‎ sal) uie in 


ce .۷‏ (أحمد GE‏ وآخرون: الْمُعجم العريّ الأساميّ» الُْنظّمة العربيّة AD‏ 


MA لاروس»‎ ce shelly BL, 
d gal LN الوسيطء مكتبة الشّروق‎ Seal بالقاهرة:‎ STA تجمع اللغة‎ .۸ 
aye "é b 
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هذه الطبعة إهداء من SAM‏ 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


-yć Y- 


الدكتور/ oe‏ عبد GID‏ علي رشوان 

dll cuan fad,‏ بقسم الإلكترونيات والاتصالات 
الكهربائية في OS‏ اهندسة - جامعة القاهرة. تخرّجَ عام AVY‏ \ 
وكان الأول على دفعته» hers‏ على a»‏ ماجستيرات» ثم 
على الدكتوراه من جامعة كوين بكندا؛ أشرف على أكثر من ماثة 
رسالة ماجستير ودكتوراه. يدير الشّركة ا هندسيّة لتطوير النْظّم £57 RDI Za‏ المتخَصّصة 
فى ال Elid ols‏ 


الدكتور/ لمعت بالله السّعيد ab‏ 

أستاذ الدراسات اللو a‏ المُساعد بجامعة القاهرة» وأستاذ 
اللا ا RW E icf dignas HE OUS NE‏ 
a‏ وَحدة الموارد المعجمية بمشروع م مُعجم الدّوحة. 

LÀ‏ نحو ثلاثينَ ورقة chale‏ بالإضافة إلى عددٍ من الكتب 
في المُعجوية CI‏ والدّراسات pal‏ المُعاصرة» els‏ ل اک من دة 
مشروعات Bw‏ دول في ميادين fa~. Eel cs LLL‏ على عد من الجوائز 
في aaa OLS‏ منها : جائزة (ألكسو (ALECSO‏ للوبداع والابتكار في t Lm‏ 
AN ALL,‏ للح er seti all‏ زة راشد بن حميد للعلوم والثقافة. 


الدكتور/ أحمد راغب أحمد 

l if AlN CER asd‏ ورئيس قشم اللغة 
العربية وآدابها بالجامعة الإسلامية العالمية باليزيا. حصل على 
درجة الدكتوراه من جامعة القاهرة عام 8 * .Y*‏ وَنَشَّرَ عددًا 
من الأوراق البحثية في دورياتِ علمية ؛ كا شارك في العديد من 
الراك Pei‏ مو ال ولك ع diga‏ ات 
العلمة: 
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هذه الطبعة إهداء من SA‏ 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا 


gj محمد‎ Bhs KE الدكتور/‎ 

حصل من جامعة القاهرة على بكالوريوس هندسة 
الاتصالات الكهربائية والإلكترونيات عام 1145١م, des‏ 
الماجستير في هندسة الحاسبات عام ١٠٠5م.‏ ثم على درجة 
الدكتوراه في هندسة الاتصالات الكهربائية والإلكترونيات عام 
1م عمل بالشركة kansi‏ لتطوير النظّم 4243 RDI‏ 
منذ يوليو 1146م إلى eY Vs le‏ وبينَ le‏ ۷١٠۲م‏ و ٠١‏ ١م‏ أستاذا Uil;‏ في 
كلية الحاسبات وتقنيات المعلومات بالأكاديمية البحرية للعلوم والتكنولوجيا والنقل 
dm gal‏ القاهرة» ole pl bbe,‏ بشركة «لوكسور تكنولوجي» الكندية 
GST / oii b‏ منذ 9١٠٠م‏ إلى الآن» وخبيرًا OL aU‏ الحاسوبية LE Wy‏ 
لمشروع «معجم الدوحة التاريخي» بين VE Cale‏ موم 


الدكتور/ سامح سعد أبو الجد الأنصاري 
يعمل أستادًا OGL‏ الحاسوبيّة ورئيسًا لقسم OG pall‏ 
MU‏ كاه Stas ee 45 4 MT zen cop‏ 
et all‏ الحاسوبيّة العربيّة بمكتبة الإسكّندَريّة. شارك في العديد 
a‏ م العلمية و ] 8 ca Sii‏ قار all ce‏ 


بالولايات WT‏ الأ T eis Bad sts tae‏ الحاسوبية العامة 


- 


€ 


هذه الطبعة إهداء من المركز 


ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
m——" «—‏ 


مباحث لغوية 00 


3 . äa ELI D 


&lllauug5‏ العَرَبِيّة 


يُصدر مركز الملك عبدالله بن عبدالعزيز الدولي لخدمة اللغة العربية هذا الكتاب ضمن سلسلة 
(مباحث لغوية)ء وذلك وفق خطة عمل مقسمة إلى مراحلء لموضوعات علمية رأى المركز حاجة المكتبة 
اللغوية العربية إليهاء أو إلى بدء النشاط البحثي فيهاء واجتهد ب استكتاب نخبة من المحررين والمؤلفين 
للنهوض بعنوانات هذه السلسلة على أكمل وجه. 

ويهدف المركز من وراء ذلك إلى تنشيط العمل 2 المجالات التي LS‏ إليها هذه السلسلةء سواء أكان 
العمل علميا بحثياء أم عمليا تنفيذياء ويدعو المركز الباحثين كافة من أنحاء العالم إلى المساهمة .2 هذه 
السلسلة. 

Ss‏ الأمانة العامة أن تشيد بجهد السادة المؤلفين؛ وجهد مَحرْرَي الكتاب» على ما تفضلوا به من رؤى 
وأفكار لخدمة العربية 4# هذا السياق البحثى. 

والشكر والتقدير الوافر لمعالي وزير التعليم المشرف العام على المركزء الذي يحث على كل ما من 
شأنه تثبيت الهوية اللغوية العربيةء وتمتينهاء وفق رؤية استشرافية محققة لتوجيهات قيادتنا الحكيمة. 

والدعوة موجهة إلى جميع المختصين والمهتمين للتواصل مع المركز؛ لبناء المشروعات العلميةء وتكثيف 


الجهود, والتكامل نحو تمكين لغتنا العربيةء وتحقيق وجودها السامى 4 مجالات الحياة. 


الأمين العام للمركز 
أ. د. محمود إسماعيل صالح 
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